@jinsongzhaocn 他用的 codex ,codex 的上下文挺短的。我的是放在 gemini.md 中,codex 自己都去读了,没有遇到不读的情况。不过可能 gemini.md 要求更加严格一些?
@canyue7897 @qwerasdf123 @jinsongzhaocn 是的,降智是我现在最怀疑的原因,关键是:各种模型验证站都测不出来!发个帖也是看看有没有朋友遇到类似的问题。 我这里思考时间比较波动,有时候 10 分钟,有时候就一句话结束。但确实思考长的时候,主帖提到的情况会少一些。 我是直接用的官网账号,在模型验证站上测模型验证的时候,通过的是我自己的 AxonHub 。 @lscho 没有特殊场景,也没有加什么野鸡 skills 、或超长的 agents.md 、或用一个已经特别长的 context 不压缩,就是正常地下载 codex 、安装、登录,正常地提问和命令,就出现了这里提到的大部分问题了。
感觉用的跟你不是同一个 gpt-5.5 xhigh 第 1 点,我跑的项目没有做过特殊要求,每次都会做一遍编译测试,有时只改了很小的点,也会跑一遍完整的编译测试 第 5 点,特地在 AGENTS.md 写了使用 conda 环境的 python ,用到目前没有出现过偏差的情况,写入 AGENTS.md 之前是会调用系统默认的 python, uv
我是直接用的官网账号,在模型验证站上测模型验证的时候,通过的是我自己的 AxonHub 。你这个是 web 转 api 么?如果是,那 web 中间的很多工具调用你这个工具肯定不能完整模拟,很多都丢弃了,那你根本就是断断续续的得到信息,你直接用 codex 试试,不会出现你说的问题的。codex 还是很遵守指令的,有的时候过于遵守了,我都感觉没啥主动性。
@codingerj 因为想看看是不是降智了,就像楼上很多人怀疑的那样。 并非:买了 GPT Pro 账号 -> 用号质量检测站「是否是满血模型」 而是:买了 GPT Pro 账号 -> 体验很差,遇到了各种问题 -> 发帖求助 -> 评论怀疑是被 OpenAI 路由到降智模型 -> 实在没办法,用质量检测站检测一下
如果你没有说谎,且不是登录账号之后又配置了第三方中转站,那只能是模型降智了,但理论上即便降智也不至于发生 1 和 2 的情况,你要不要检查一下你的设置,全局的 skill ,全局的 AGENTS.md 文件,项目内的 AGENTS.md 。