claude code 实践心得:飘才是最大的敌人

查看 111|回复 11
作者:ximaoyang   
现在基本都是 100% cc 写代码了。也用过 superpowers 之类的牛逼哄哄的 skill 。现在基本每几天就能看到一个自动做 multi-agent 项目的框架,skill ,产品,都疲劳了。个个描述的都很科幻,启动一堆机器人帮你干活,你就一边歇着去。具体使用起来的感受一言难尽。发现都是等几个小时,然后写出来是一个 UI 看起来确实是我刚刚开始说的东西,但是内部是一坨
而且这些 multi-agent 框架现在都在比谁更智能,使用者可以完全不用动。但是程序员是不喜欢这种感觉的,程序员是喜欢透明的。因为我们知道天上不会掉馅饼。低代码框架这么多年也没推开,就是因为那玩意做个简单的不怎么改的小网站,小商城确实是可以。但是你要放公司层面这么搞,最后改 bug 的不还是自己。
我觉得现在 ai 编程最大的问题就是模型会飘,就跟游戏传声筒一样,最后一个人复数出来的话跟第一个人说的完全对不上。如果你启动一个 agent 它可能飘 1 步,你启动多个 agent ,agent 跟 agent 还是上下游关系的话,最后,飘到 100 步开外都不止

AI, 编程, 模型

lolo1   
复议,所以不明白为啥很多人还在开发什么基于角色的流程 agent ,毫无意义。信息在传递过程会无限失真,一个 cc 能搞定就不要用多个乱七八糟的 agent
wonderfulcxm   
用 muti-agent 的场景是什么?我很好奇。
在 ui 这里,是多个 agent 同时设计不同的页面吗?
ximaoyang
OP
  
@lolo1 是啊,而且宣传的例子都差不多,开头就是一句“我想做一个网上商城”然后模型就 ask 你要怎么做啊,要什么架构啊,然后生成一份超长的 SPEC ,然后吭哧吭哧的开始干。
但是哪家程序员是这么干活的。我们不可能从 0 开始做一个网上商城。我们都是在维护一个已经用了很多年的系统,然后每天从 jira 上拿 ticket 下来做。每个 ticket 基本都是给这个购物车加个 xxx 功能。给用户评论加个啥之类的,偶尔会来个大的,比如加个新的模块,这就够大了。
当然你可以把小 ticket 丢给 superpowers ,它也可以帮助拆解,然后丢该子 agent 。但是我发现这就是杀鸡用牛刀,写出来的还是一坨,我只能打断它让它不要去提交代码,我先看一遍。然后发现这都没必要用这玩意。直接把 ticket 用 cc 自己分析一下,然后让 cc 写完别提,然后自己审核一下,虽然慢,但是之前 superpowers 写的那是啥玩意。
ximaoyang
OP
  
@wonderfulcxm 就是需求拆解,然后去做
ota   
那有专门做规范层的 skill 嘛?推荐推荐。我也想知道怎么保持统一性。
agent 生成时严格按照 Schema 结构定义,不然回滚重新来。然后加个全局约束作为锚点。
为了防止 agent 对上下游的自然语言依赖,这一层要清洗成 Schema 。agent 之间禁止传送自然语言?这样指数飘就能缓解不少了。但工程实践具体怎么个 flow ,还有待 op 实践分享。
ximaoyang
OP
  
@ota 我自己也是一坨,你说的这个确实我也需要,哪里有这样的好东西,给我来一打,跪求
回滚这个是个好主意!
GeruzoniAnsasu   
> 我觉得现在 ai 编程最大的问题就是模型会飘,就跟游戏传声筒一样,最后一个人复数出来的话跟第一个人说的完全对不上。如果你启动一个 agent 它可能飘 1 步,你启动多个 agent ,agent 跟 agent 还是上下游关系的话,最后,飘到 100 步开外都不止
本质在于 LLM 的输出即思维。这是一个类似不确定性原理的模型 —— 想要观测模型思维就必须让它输出,想让它输出就必须先有输入,有输入就会干扰其输出权重。结果就是,你无法同时获得( LLM 对概念的精确理解|LLM 对概念的自主思考)。这两个共轭量的「乘积」整好反应了模型的底层实力,有这个基本原理存在决定了不可能用外部治理的手段把模型能力提升到更好模型的水平。
> 个个描述的都很科幻,启动一堆机器人帮你干活,你就一边歇着去
但凡做过真实产品的人都知道这「从信息论的意义来说」就不可能。所以自动化 agent 产品的核心价值在于怎样定义最适合 agent 发挥,同时人类能最好、最简单掌控局面的协作模式。其实绝大多数产品都没在尝试除了「让 AI 根据 prompt 放手干」之外的模式,效果必然都在同一个不尽如人意的水平上晃荡。
ximaoyang
OP
  
@GeruzoniAnsasu 共轭量的「乘积」。我去,专业人员
xialaoban   
尝试过 subagent/muti-agent 直接工作,也试过 cc 指挥/codex:rescue 多 agent 工作,superpowers 会要求很小的实现,配合多 agent 确实看起来很嗨,但我真的没感觉到效率提升,也没有大家宣传的可靠性。
全新项目和旧项目维护,改到最后都会变成一坨屎。。。
大量代码我看不过来,又只能让 agent 自己 review ,它又抓不到重点,还经常丢三落四。。。
和几年前比起来依旧是上下文丢失的老问题,写着写着就不再主线上了,总是钻进小细节无限套娃
您需要登录后才可以回帖 登录 | 立即注册

返回顶部