这可能是下一个周经帖:国产大模型哪个编程能力最顶?

查看 174|回复 21
作者:kaesi0   
如题,在不考虑价格的情况,目前国产大模型哪个编程能力最顶呢,以及各自的擅长领域,参赛的选手有:
GLM-4.6:说是 Claude Sonnet 4.5 和 GPT-5 ,但价格仅需要 Sonnet 1/7
Qwen3-Code:SWE-bench Live 测试中得分 54.7 ,超越 GPT-4.1 ( 48.6 ),中文 API 文档理解准确率达 92%
DeepSeek-V3.2-Exp:说是被 GLM4.6 超过,但在 Vercel 、Windsurf 等编程平台接入
MiniMax M2:每 token 成本仅为 Claude Sonnet 的 8%、在 Terminal-Bench 测试中得分 37.5 ,专为 Agent 工作流设计

国产大模型, 编程能力, 擅长领域

courtier   
我觉得就是考虑了价格的情况下才会使用国产大模型。。。主打性价比,不然 Claude ,gpt ,gemini 不香吗
gorvey   
不好说,你不知道它什么时候会降智,本来就不聪明,一降智就很难用,反正就是都不行
abc0123xyz   
GLM-4.6 不错,240 块的套餐,要是觉得不好,那肯定是我自己的问题(穷)
sunny352787   
我全测过一遍,结论是全是垃圾,不要在这上面浪费时间了,所谓的价格七分之一,但是你耗费的时间不只七倍,能力极差性价比极低,老老实实用 opus4.5 或者 gemini pro3 ,别的都是浪费生命
midsolo   
GLM-4.6 之前用起来还不错,但是在出了背刺包之后,用量太多了,总是莫名其妙的降智,严重影响体验
keshawnvan   
全是垃圾,别浪费时间。
ericguo   
kimi-for-coding 还行,49 元每周 1024 次调用
cleveryun   
好奇问一下,GLM 4.6 ,在 trae 和 iflow cli 里都有免费的,用这个和用 GLM coding plan 里的付费套餐,对应的是同样的大模型吗,网速上或者功能上有差异吗?
abc0123xyz   
刚出的时候最好,这个时候为了宣传,不怎么降智。
您需要登录后才可以回帖 登录 | 立即注册

返回顶部