高强度使用了半年 claude code 后，我终于无法忍受了，并且我发现了绝佳替代

查看 1387|回复 101

2026-5-9 16:01:50

@stimw 这些数据集里的数据都是 user-assistant 的对话堆起来的，然后让模型去 recall 用户提及的细节、偏好等等；但是现在 agent 的模式是任务式的，user 说一句，assistant 要跑好几十轮，召回的主体也从用户细节变成了任务细节（实现 task 中的某个具体步骤）。那原先的测评明显就不合适了。。

defunct9 2026-5-9 16:02:34

@fj19 算，但是你如果花了 5 分钟体验的话，你会感谢我的

Dream4U 2026-5-9 16:03:34

折腾了半小时，放弃了。滚回去用了 hermes 。

giter 2026-5-9 16:04:18

对这种一边贬低别人，一边自己牛逼吹得山响的项目，直接拉黑，试都不会试。

h4nru1

2026-5-9 16:05:08

上联：拳打 Claude Code
下联：脚踢 Codex
横批：牛逼坏了

h4nru1

2026-5-9 16:05:40

@Dream4U 对这种把 benchmark 结果当贬低、把数据对比当吹牛的阅读理解能力，直接理解，跪久了的确站不起来。

h4nru1

2026-5-9 16:06:35

@defunct9 何不把 key 和 github 链接给 Hermes ，让他帮你装？如果他这都做不到，你留他有什么用？

QAZXCDSWE 2026-5-9 16:07:12

@giter hhh ，正是如此。感谢你帮我说出了心里话

HFX3389 2026-5-9 16:07:44

有没有想过一个问题，这么牛逼 A\都融资超过上千亿美元了，这项目是不是要国家队接见？

h4nru1

2026-5-9 16:08:34

agent 类太多了，官方的 CC CX ，还有 pi warp ，再加上这个

高强度使用了半年 claude code 后，我终于无法忍受了，并且我发现了绝佳替代

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

高强度使用了半年 claude code 后，我终于无法忍受了，并且我发现了绝佳替代

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告