这可能是下一个周经帖：国产大模型哪个编程能力最顶？ ...

作者：kaesi0 发布时间：2025-12-15 14:04:54

如题，在不考虑价格的情况，目前国产大模型哪个编程能力最顶呢，以及各自的擅长领域,参赛的选手有：
GLM-4.6：说是 Claude Sonnet 4.5 和 GPT-5 ，但价格仅需要 Sonnet 1/7
Qwen3-Code：SWE-bench Live 测试中得分 54.7 ，超越 GPT-4.1 （ 48.6 ），中文 API 文档理解准确率达 92%
DeepSeek-V3.2-Exp：说是被 GLM4.6 超过，但在 Vercel 、Windsurf 等编程平台接入
MiniMax M2：每 token 成本仅为 Claude Sonnet 的 8%、在 Terminal-Bench 测试中得分 37.5 ，专为 Agent 工作流设计

国产大模型, 编程能力, 擅长领域

相关帖子

courtier 2025-12-15 14:05:33

我觉得就是考虑了价格的情况下才会使用国产大模型。。。主打性价比，不然 Claude ，gpt ，gemini 不香吗

gorvey 2025-12-15 14:06:07

不好说,你不知道它什么时候会降智,本来就不聪明,一降智就很难用,反正就是都不行

abc0123xyz 2025-12-15 14:06:58

GLM-4.6 不错，240 块的套餐，要是觉得不好，那肯定是我自己的问题（穷）

sunny352787 2025-12-15 14:07:53

我全测过一遍，结论是全是垃圾，不要在这上面浪费时间了，所谓的价格七分之一，但是你耗费的时间不只七倍，能力极差性价比极低，老老实实用 opus4.5 或者 gemini pro3 ，别的都是浪费生命

midsolo 2025-12-15 14:08:23

GLM-4.6 之前用起来还不错，但是在出了背刺包之后，用量太多了，总是莫名其妙的降智，严重影响体验

keshawnvan 2025-12-15 14:09:09

全是垃圾，别浪费时间。

ericguo 2025-12-15 14:09:50

kimi-for-coding 还行，49 元每周 1024 次调用

cleveryun 2025-12-15 14:10:40

好奇问一下，GLM 4.6 ，在 trae 和 iflow cli 里都有免费的，用这个和用 GLM coding plan 里的付费套餐，对应的是同样的大模型吗，网速上或者功能上有差异吗？

abc0123xyz 2025-12-15 14:11:33

刚出的时候最好，这个时候为了宣传，不怎么降智。

这可能是下一个周经帖：国产大模型哪个编程能力最顶？

相关帖子

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

这可能是下一个周经帖：国产大模型哪个编程能力最顶？

相关帖子

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告