高估了 GPT5.5 ehigh 的能力

作者：ryougifujino 发布时间：2026-6-22 09:58:16

周末用 GPT5.5 ehigh （全程官方订阅+Codex ）写了一个 AI 小说 App 。
PRD 是和 AI 讨论后再 Review 实现的，然后 5.5 根据 PRD 生成实现计划。主要涉及到上下文管理和多 Agent 协作，还是有一点复杂。
用 goal 跑了接近 2 个小时，用的 TDD 的流程开发的，代码看起来像模像样的，测试也很全。结果最后的成品让我大吃一惊，不但点按钮没有任何反应，在把可见 Bug 通过把报错信息丢给 AI 修复后发现很多地方还是用不了，直接用的模拟数据。而且有很多地方设计也很不合理。
之前在修复某一个 Bug 或者解决某一个单一需求时 GPT 给我的感觉良好，结果这种长程任务没想到完成的这么糟糕，也不知道是模型降智了还是能力上限就在这了。

GPT, 开发, 能力

相关帖子

musi 2026-6-22 09:59:07

可能是降智了
我让它拆分重构一个 8k+的 ts 文件
它先帮我 copy 了一份然后 rename
在原始文件中导入这个新的文件
然后和我说重构完成，现在只有一行代码

JasonYip 2026-6-22 10:00:01

感觉现在 ai coding 长程任务还是避免只能人工拆解需求一点点丰富实现到后面上下文腐化太明显

deepbytes 2026-6-22 10:00:53

配合 superpower 或者 ponytail 试试

willm 2026-6-22 10:01:29

@musi 完美

maolon 2026-6-22 10:02:18

不光削了 thinking effort ，还肯定量化了模型，现在 5.5 蠢的没法用，
我觉得单纯写代码还不如 composer2.5, 和两个月前比根本不是一个模型。

Dream4U 2026-6-22 10:02:57

准备上 5.6 了

lujiaosama 2026-6-22 10:03:48

@deepbytes 一样的。SUPERPOWER+GOAL+5.5 EXTRA HIGH 仍然不能避免最后端了陀大的出来。只能阶段性人工确认有没有问题才往下。

wuyiccc 2026-6-22 10:04:48

是的，昨晚用 5.5 xhigh 写代码，我说让他直接抄我前面的代码就可以了，结果写出来的代码差点给我快气死，

andrew2558 2026-6-22 10:05:20

@musi 这么离谱？

高估了 GPT5.5 ehigh 的能力

相关帖子

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

高估了 GPT5.5 ehigh 的能力

相关帖子

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告