API 网关调试 · 集合推理 · 压力测试
同时调用多个国产大模型(DeepSeek、MiMo、Agnes等)处理同一任务,聚合对比各引擎输出,自动评分选出最佳结果。
自定义 M1-M4 四阶段处理管线:复杂度判断 → 并行推理 → 结果整合 → 结构化输出。
记录每次调用的 Token 消耗与响应时间,生成统计报表,便于性能分析和资源评估。