API Gatling

API 网关调试 · 集合推理 · 压力测试

个人技术学习与展示

🔀 国产多引擎并行调用

同时调用多个国产大模型(DeepSeek、MiMo、Agnes等)处理同一任务,聚合对比各引擎输出,自动评分选出最佳结果。

📋 工作流编排

自定义 M1-M4 四阶段处理管线:复杂度判断 → 并行推理 → 结果整合 → 结构化输出。

📊 用量追踪

记录每次调用的 Token 消耗与响应时间,生成统计报表,便于性能分析和资源评估。

进入工作台 →