Claude Opus 4.6 是用的 cursor 的 Opus 4.6 MAX(思考),GPT5.4 是用的 codex(最高推理度),同样针对一些需求写计划,claude 写的计划总是能被 GPT 找到问题,而且确实存在。不过 GPT5.4 是后出的,比 Opus4.6 强情有可原...这几天打算先用 gpt 写计划了,claude 只负责把计划写成代码节约一点 codex 额度
其实不管啥模型,「实现功能」和「检查功能」两者思维路径是不一样的。 「实现功能」重点是实现,把东西运行起来是第一要务。 「检查功能」则是看这个东西是否有可能出错。 A 模型写,A 模型自查自纠,A 模型再一次自查自纠,B 模型检查,B 模型再次检查,A 模型根据 B 模型的反馈进行检查修改,能够有效提升代码质量。