利用"专家模型"实现低成本类 AugmentCode 效果的设想 ...

作者：sxueck 发布时间：2025-10-24 11:41:06

先说效果：这个做法能实现 AugmentCode 模式 80% 的效果，成本的话因人而已，我订阅的一直是 50usd 的套餐，因此如果我替换成这个方案其实能省下将近 40% 的成本
专家模型的灵感来自于 MoE 模型，前置的门控分类器根据输入的权重下发给 topk 靠前的子模型，我也是仿照了这个思路并调整，不过我们并不基于 Tokens ，而是基于 Query ，这个在 Higress 里面已经有了一个 LLM 意图识别插件（但是配置太麻烦了）
针对 Vibe 场景，我将 Query 分类为

chat_simple

code_generation

code_refactor_edit

code_debug_analysis

testing

docs_and_comments

other

（可惜 V2EX 发不了图）
这里关键节点来了，我将 code_debug_analysis 配置为 Claude Sonnet 4.5 （找的中转站逆向），其他的可以按需分配，例如 testing 可以为 GLM 4.6 ，docs 可以为 Gemini 2.5 Pro
测试结果：
公司项目，一个 Golang CRI 调度器，纯 Go 代码行大概在 1.5w 左右，在没有给出具体文件路径和函数的情况下，修复一个 BUG ，请求约 6 次，一次通过，查看了一下后台记录，其实关键的逻辑处理部分，是 Claude sonnet 4.5 在承担并且保持整个 debug 方向，对于调用工具和输出文档，以及修改代码部分，都是交给其他模型进行的，所以整体测试下来体验都非常好
我也在想商业插件例如 Cursor 是不是也是这样实现的，不过他们更专业，可能可以使用 BERT 进行精准分类，同时低级任务交给 haiku 等

专家模型, 低成本, AugmentCode

利用"专家模型"实现低成本类 AugmentCode 效果的设想

相关帖子

热门主题

国产英伟达，摩尔把上市融资的75亿元拿去买

✅DMIT 三网 GIA CMIN2 MALIBU EB 维多利亚

有MJJ遇到过TG号全部设备都被登出了吗？

【快讯】HostHatch Seoul HH 新节点首尔

Hk-One-0.5G-52-LS 少量放貨速度

公司项目分享：硅谷人工智能公司 Nexa AI

拿到了 300 来部短剧的海外发行版权，下一

长话短说大家觉得花三十万结婚，存款花完

建议拉黑 IObit 旗下所有软件

重度苹果用户投华做了两面派

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则