关于快速迭代理论的思考

查看 4|回复 0
作者:zisen   
首先是在 b 站刷到了这个 OpenAI 员工翁家翌的访谈视频:
翁家翌:OpenAI ,GPT ,强化学习,Infra ,后训练,天授,tuixue ,开源,CMU ,清华| WhynotTV Podcast #4
访谈视频中翁家翌提到他是 OpenAI 的 infra ( LLM 基础设施)建设的,在他的观点看来,哪家 ai 公司更有能力看的并不是谁家的模型又上了 Benchmark 排行榜第一名,而是公司内部的 infra 的对于 llm 的迭代速度。
视频中他提到,OpenAI 内部用于训练 ChatGPT 的 infra 已经是三年前搭建的了,而他们仍然还在准备新一代的 infra ,这是 OpenAI 面对 DeepSeek, Gemini, Claude 时较为乏力的原因,这些后来者的 infra 比 OpenAI 的更加先进,这意味着他们可以更快地对 LLM 进行迭代。
随后又刷到了美国战争部长去 SpaceX 向 Elon Musk 取经的视频:
美国防部长走访马斯克星舰基地!要把第一性原理搬到五角大楼!
Musk 的 SpaceX 或者说 Tesla 的成功原因,一个是他的“第一性原理”,另一个就是他的“快速迭代理论”。
快速迭代理论说的是:并不是从一开始就做一个完美的产品,而是先做一个差不多的产品,然后用最快速度去逼近完美。
而 Musk 的星舰基地,就是一个快速迭代的平台,这个星舰基地有充足的资源让他可以不断试错不断发射失败,发射失败的速度越快,他距离成功的速度也就越快。
同理,回到 LLM 的迭代中,各家 AI 公司其实真正需要的不是一个牛逼的算法或者架构,而是可以最短时间内验证一个 idea 的能力,任何人有 idea 或者算法都可以在最短时间内集成到产品中去,从而判断是否可以加强产品能力。
这也是 DeepSeek 在 2025 年初能够释放重磅炸弹的原因,幻方量化有足够的 infra ,才能实现他们各种颠覆性的 ideas 。
LLM 的 infra 是 AI 公司的算力基建和训练管道,而对于普通程序员或者独立开发者来说,其实 idea 并不重要,因为这个世界上有太多的 idea 了,在 idea 落地之前,没人知道这个 idea 能否成功,重要的是实现 idea 的 infra ,也就是现在的 coding agent 。
因此,作为开发者,在 2026 年,一个 idea 落地的效率大大提高,因此没有必要再去问值不值得做,而是先 vibe coding 一个最简单的核心出来,然后看市场反馈,如果反馈好那么使用快速迭代理论来疯狂地接近成功。
另外再举一些生活中的例子,比如你想开一家咖啡馆,而你本身并没有开咖啡馆的经验,你要做的不是花几十万重金盘下一个店面装修再购买数万元的设备,而是使用最低成本:买二手设备,租便宜店面,先简单装修等等压缩成本的方式开一家咖啡馆,然后看自己能不能开好这家咖啡馆,如果营业不下去了就倒闭,然后总结经验,继续开始下一次试错。
到目前为止想的就这么多,本想用 AI 优化一下排版,但是不希望 AI 代理我的语言输出,大家将就看吧。
您需要登录后才可以回帖 登录 | 立即注册

返回顶部