Anthropic 家的模型训练与其他家差别大吗？

查看 145|回复 8

作者：Kinnikuman 发布时间：2026-3-13 12:18:25

大家都知道 Anthropic 家的模型，尤其是 Opus 的实力，在编码的实际体验中是最强的，没有之一。即使拿 gemini3.1pro 和 gpt5.3codex 比，这俩也是比不上它一点。
除了编码，大家跑龙虾也能感觉出来差别很大，尤其是多步骤工具链的复杂任务只有 opus 能完美胜任，opus 画的 svg 动效流程图也是比新的 gemini 强很多。
我的问题是，公开互联网训练数据大家都是一样的，各家的 RL 也差不离（这点应该没什么技术壁垒），经济实力上 OpenAI/Google 应该更有优势，那为什么训练出来的大模型只有 opus 家最强？
是 Anthropic 家训练更强调代码能力，侧重点不同导致的吗？

neteroster 2026-3-13 12:18:58

https://cursor.com/blog/cursorbench
今天刚发的，内部包含 cursor 在真实用户的真实编码场景中遥测出的评测数据
Opus 不说落后，在编码上已经没有全面领先态势了。

6diyipi 2026-3-13 12:19:43

直观感受。Opus 花了 200 写的 bug, codex 一次修复、完美

LHN 2026-3-13 12:20:31

`即使拿 gemini3.1pro 和 gpt5.3codex 比，这俩也是比不上它一点。`谁告诉你的这俩比不上一点啊,我用 codex 解决不了的问题 opus4.6 也解决不了,claude 目前用着就是速度快一点

CoderUndefined 2026-3-13 12:21:15

@neteroster #1 但是看大部分反馈用 claude code 效果还是比 codex 好一些，可能各家 cli 工具，在工程上还有所不同

kelvinji2009 2026-3-13 12:22:00

每个人的体感不太一样，综合看 Opus 4.6 和 GPT 5.4 high 交替被夸。某个模型解决不了，换另外一个就解决了，这个也不能直接说明哪个模型更强，很可能跟上下文有关。交叉使用多个模型解决问题，也算是一种最佳工程实践了。

sillydaddy 2026-3-13 12:22:57

真的差别那么大吗，没有特别大的感觉，我的感觉反而是 gpt5.3codex 比较稳定可靠。我是在 cursor 内测试的。
下面的乘法题，gpt5.3codex 能做到，但 opus4.6 做不到（推理卡死、直接放弃改用 python ）。都是用的最高推理能力。
```
你能不借助工具，心算一道乘法题吗？为保证准确性，你必须要一步一步计算。这里的一步一步是指无论加法还是乘法，都只取 1 位数字计算。也就是 1 位数乘以 1 位数，1 位数加 1 位数，无论是中间过程还是结果。
8346783724985839204724623 * 7827329472626174
```

bbbblue 2026-3-13 12:23:40

我感觉不太出来了。。。
之前 cc 现在用 codex 用了几个礼拜了。。。没啥太明显的差别可能唯一有变化的是 gpt 写完之后会自己再精装修一下（但是 cc 偶尔也会其实也没太大区别。。。

mogutouer 2026-3-13 12:24:25

gpt 5.4 出来后感觉逻辑上没差别了，不过前端美观度还是 claude 略胜一筹，codex 有点直男。gemini 号称最强美工但 css 经常错乱，刚 3.1 刚发布的时候不是有个日见夜间切换按钮，尝试给他图片弄了一个，始终有样式问题，最后还是 claude 重来弄好的。
https://imgur.com/O1J5fpq
https://i.imgur.com/O1J5fpq.mp4

Anthropic 家的模型训练与其他家差别大吗？

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

Anthropic 家的模型训练与其他家差别大吗？

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告