从 Composer 2.5 想到微软再次崛起的可能性

查看 28|回复 4
作者:ryougifujino   
最近我使用了 Cursor 的 Composer 2.5 ,第一感觉是:速度很快,写代码也出乎意料地不错。尤其在最近 GPT 疯狂降智,有时我甚至觉得它比 GPT 更好用。更让人惊讶的是,Composer 2.5 并不是一个从零训练的大模型,而是基于 Kimi K2.5 ,再经过 Cursor 自己的 continued pretraining 、强化学习,以及面向真实 coding agent 场景的后训练改造而来。
这件事很有意思。
过去很多人把 Cursor 这类 AI IDE 看成“套壳”App:底层调用别人的大模型,外面包一层编辑器体验,再通过 prompt 、上下文管理和工具调用做工程优化。按照这种理解,Cursor 的核心价值应该主要来自产品体验,而不是模型能力。
但 Composer 2.5 的出现,让这个判断变得没那么简单。
它说明,一家应用公司不一定只能调用模型。只要它拥有真实的垂直场景、用户反馈、agent workflow 、eval 体系和后训练能力,就有可能在已有开源 checkpoint 之上,训练出非常强的专用模型。
更重要的是,Cursor 的路径并不是孤立完成的。Kimi K2.5 提供了强大的基础模型,Fireworks AI 这类平台提供了托管训练、RL 、推理和部署基础设施,Cursor 则提供了真实软件工程场景和高质量的 coding agent 经验。三者结合起来,降低了垂直模型训练的门槛。
这可能是 AI 行业的一个重要信号:
未来不一定只有 OpenAI 、Anthropic 、Google 、Meta 、Moonshot 这类基模公司才能训练强模型。拥有高价值应用场景的公司,也可能基于开源模型和基础设施平台,训练出适合自己领域的垂直模型。
一、为什么 Composer 2.5 可能比原始 Kimi K2.5 更适合写代码?
Composer 2.5 最值得关注的地方,不只是它强,而是它建立在 Kimi K2.5 这样的 base model 之上,编程能力却比它强得多。
这说明我们不能简单地把模型能力理解为“基础智力”。
Base Model 更像是一个人的通用智力、知识储备和底层能力;后训练则像是给这个人注入某个领域的经验、习惯、方法论和工作流。
一个基础智力很高但缺少真实工程经验的人,未必能成为顶级软件工程师。相反,一个基础智力不错、但长期在真实工程环境中训练的人,可能会变得非常强。
coding agent 真正需要学会的,也不是简单“生成一段代码”,而是一整条工程链路:
理解需求、阅读项目、找到相关文件、决定修改方案、调用工具、运行测试、识别报错、修复问题,最终交付可运行结果。
传统互联网代码数据告诉模型:代码长什么样。
真实工程轨迹告诉模型:软件是怎么一步步做出来的。
这两类数据的价值并不一样。
如果说 Base Model 给了模型“基础智力”,那么 Cursor 的产品场景和后训练,可能给了 Composer 2.5 “软件工程经验”。它未必在所有通用能力上都超过原始模型,但在 Cursor 这个具体工作流里,它被训练得更像一个真正的 coding agent 。
二、Fireworks AI 这类平台正在降低应用公司训练模型的门槛
Composer 2.5 这个案例里,Fireworks AI 也很关键。
如果说 Kimi K2.5 降低了模型基座的门槛,那么 Fireworks AI 这类平台降低的就是训练、推理和部署基础设施的门槛。
过去一家应用公司想训练自己的模型,需要自己解决 GPU 集群、分布式训练、推理服务、RL rollout 、权重同步、弹性扩缩容、成本优化和线上稳定性等问题。对大多数应用公司来说,这几乎是不现实的。
但现在,开源模型提供了强大的起点,基础设施平台提供了托管训练和推理能力。应用公司就不一定需要从零搭建底层系统,而可以更专注于自己真正擅长的东西:
场景、数据、产品、用户反馈、eval 、agent workflow 和垂直领域经验。
这会改变我们对“应用层公司”的理解。
过去的分工是:
基模公司负责训练模型,应用公司负责调用模型。
未来可能变成:
基模公司提供通用基础能力,基础设施平台提供训练和推理能力,应用公司基于真实场景训练垂直模型。
Cursor 的意义就在这里。它不是一个孤立的产品更新,而是一个信号:AI 应用公司正在获得过去只有模型公司才拥有的一部分能力。
三、Cursor 的核心资产可能不是 IDE ,而是软件工程轨迹
很多人过去把 Cursor 看成一个更好用的 VS Code + AI 插件。
但从 Composer 2.5 的角度看,Cursor 的核心资产可能不只是编辑器本身,而是它位于真实软件工程工作流的中心。
一个 AI IDE 每天都会接触大量真实任务:
用户想做什么功能,AI 如何规划,改了哪些文件,调用了哪些工具,哪里失败,人类如何修改,哪些建议被接受,哪些建议被拒绝,最终代码如何落地。
如果这些数据能够在用户授权、隐私合规和合同允许的前提下用于产品改进或模型训练,那么它就不是普通产品数据,而是高价值的 agent trajectory 。
代码库只告诉你结果,trajectory 告诉你过程。
而 AI Agent 最缺的,恰恰是“如何完成复杂任务”的过程经验。
这也是为什么 Composer 2.5 值得被放大。它可能不只是证明 Cursor 的模型团队强,而是在暗示一种新范式:
拥有真实生产工作流入口的应用公司,可能比纯模型公司更容易获得高质量后训练数据。
四、顶级基模公司也在抢应用入口
如果只有 Cursor 这么做,我们可以把它看成一个垂直 AI IDE 公司的特例。
但 OpenAI 、Anthropic 、Google 和微软,也都在大规模进入应用层。
OpenAI 做 Codex 和浏览器,Anthropic 做 Claude Code 和 Claude in Chrome ,Google 把 Gemini 深度整合进 Search 、Chrome 、Workspace ,微软则拥有 Copilot 、GitHub 、VS Code 和 Office 。
表面上看,这些公司是在丰富产品线,从用户那里赚钱。
但对 AI 公司来说,产品还有另一层价值:
产品是数据入口,是 Agent 的运行环境,是任务轨迹的收集器,是模型能力的验证场,也是下一代后训练数据的来源。
浏览器尤其重要。
因为浏览器几乎覆盖了用户的大部分数字行为:搜索、阅读、购物、写文档、使用 SaaS 、查资料、处理工作流。未来如果 Agent 真的能替人完成任务,那么浏览器就不只是一个客户端,而可能是 Agent 的操作系统。
AI IDE 也是同理。
IDE 不只是写代码的地方,而是软件生产过程的核心入口。谁掌握 IDE ,谁就更接近真实的软件工程轨迹。
所以,顶级基模公司做 Codex 、Claude Code 、AI 浏览器,不一定只是为了卖更多订阅。更深层的原因可能是:它们必须拥有应用入口,否则长期会缺少最关键的真实任务数据。
未来真正的竞争,可能是模型能力和应用入口之间的闭环。
五、市场可能低估了工作流入口的价值
最近市场对软件公司的担忧大致是:
AI 会让软件越来越容易开发,软件开发成本下降,SaaS 产品更容易被复制,seat-based 收费模式受到挑战,所以软件公司的估值应该下降。
这个逻辑有合理性。
如果一家 SaaS 公司的价值主要来自“我写了一套别人暂时写不出来的软件”,那么 AI 的确会削弱它的护城河。
但这只是第一层。
还有第二层:
AI 会降低写软件的成本,但不会自动降低获得真实用户、真实场景和真实工作流的难度。
未来真正稀缺的,可能不是代码本身,而是用户每天如何完成真实任务的数据。
如果一个产品只是功能集合,它可能被 AI commoditize 。
但如果一个产品是高价值生产工作流的入口,它的价值可能反而会上升。
GitHub 不是普通代码仓库,而是软件协作入口。VS Code 不是普通编辑器,而是开发者工作台。Office 不是普通办公软件,而是企业知识工作入口。Figma 不是普通设计工具,而是设计协作入口。浏览器也不是普通网页容器,而是数字世界的操作入口。
这些产品在 AI 时代的价值,可能不只是收入,而是它们持续产生真实工作流数据的能力。
六、为什么微软可能被市场重新认识
微软最近股价大跌,但如果这个推论成立,微软是最值得重新审视的公司之一。
微软拥有几乎所有关键资产:
GitHub 、VS Code 、GitHub Copilot 、Azure 、Office 、企业客户、全球开发者生态、大量现金流和顶级工程团队。
过去市场看微软 AI ,更多关注 Azure 增长、Copilot 收入和 OpenAI 合作。
但如果从“工作流数据飞轮”的角度看,微软真正可怕的资产可能是 GitHub + VS Code + Copilot 。
这三者组合在一起,几乎覆盖了软件生产的核心链路:需求、代码、提交、PR 、Review 、Issue 、CI/CD 、部署、Bug 修复和团队协作。
Cursor 都能通过 AI IDE 和后训练能力训练出 Composer 2.5 ,已经让我们看到一个小型飞轮的可能性。那么拥有这些巨大资源的微软理论上可以拥有一个更大的飞轮。
当然,前提是这些数据必须在用户授权、企业合同、隐私保护和法律合规的边界内使用。拥有入口不等于可以随便拿数据训练。
但即便如此,微软拥有的工作流入口本身仍然极其稀缺。
真正的问题不是微软有没有资源,而是微软能不能把这些资产组织成一个清晰的 AI 飞轮。
七、微软过去为什么没体现出这个优势?
一个合理的问题是:既然微软拥有这么多资产,为什么它没有更早做出 Composer 2.5 这样的产品?
可能有几个原因。
第一,微软过去太依赖 OpenAI 。过去几年,微软的 AI 叙事很大程度建立在 OpenAI 之上,它可以通过投资和云合作获得模型能力,所以没有那么强的动力自己把 coding model 后训练做到极致。
第二,大公司组织复杂。GitHub 、VS Code 、Copilot 、Azure 、Office 分属不同产品线。资产很多,但要形成统一飞轮,需要很强的组织整合能力。
第三,企业隐私和合规限制很强。微软服务大量企业客户,企业代码、私有仓库和商业数据都非常敏感。即使它拥有入口,也不能像小型创业公司那样快速试错。
第四,市场过去关注的是商业化,而不是数据飞轮。投资者更容易理解 Copilot 收入、Azure 增长和 Office 提价,却未必会立刻理解“开发者工作流数据会成为下一代 coding model 的核心资产”。
所以,微软的问题不是没有牌,而是它过去可能没有把这些牌组合成一个足够清晰的 AI 飞轮。
八、这不是确定结论,而是一个投资假设
这个推论很诱人,但不能把它当成确定事实。
它有几个重要风险。
第一,Composer 2.5 的成功可能主要来自合成数据、RL 方法和工程优化,而不是 Cursor 的真实用户数据。
第二,真实用户数据未必能合法、合规地用于模型训练,尤其是企业代码和商业数据,限制会非常多。
第三,微软拥有入口,不代表它有组织能力把入口转化为模型能力。
第四,如果未来通用基模公司在没有垂直应用入口的情况下,也能持续训练出极强 coding model ,那么应用数据飞轮的重要性就会被削弱。
第五,股价表现不仅取决于长期逻辑,也取决于买入时机、估值水平、利率、财报、市场情绪和竞争格局。
所以,这不是“微软一定会涨”的结论,而是一个观察框架:
如果 Cursor 持续证明 AI IDE 数据飞轮有效,如果 Fireworks AI 这类平台继续降低垂直模型训练门槛,如果 OpenAI 、Anthropic 继续强化应用入口,如果微软开始自研并推出强 coding model ,如果 GitHub 、VS Code 、Copilot 被整合成统一飞轮,那么市场可能会重新认识微软的 AI 价值。
九、结论:软件公司的价值可能从“软件本身”转向“生产过程”
AI 会让写软件变便宜,这几乎是确定的。
但这不意味着所有软件公司都会失去价值。
真正被削弱的,是那些只靠功能堆叠、缺少工作流入口的软件公司。真正可能变强的,是那些掌握高价值生产过程的软件公司。
Cursor 的 Composer 2.5 之所以重要,是因为它让我们看到:一个 AI IDE 公司,不一定只是应用层公司。它也可能基于开源模型、托管训练平台和真实开发工作流,训练出更强的 coding model 。
OpenAI 和 Anthropic 之所以要做 Codex 、Claude Code 、浏览器,也可能是因为它们意识到:没有应用入口,就很难拥有持续生成高质量任务轨迹的能力。
而微软最特殊的地方在于,它早就拥有这些入口。
GitHub 是代码协作入口,VS Code 是开发者工作台,Copilot 是 AI coding 的用户界面,Azure 是算力和企业基础设施,Office 是知识工作入口。
如果微软能把这些资产真正组织成 AI 时代的数据飞轮,那么它不只是一个被 AI 冲击的传统软件公司,而可能是下一代软件工程模型的重要玩家。
今天市场看到的是:
AI 会降低软件开发成本,所以 SaaS 价值下降。
但未来市场可能看到的是:
AI 会提高真实工作流入口的价值,所以拥有这些入口的软件公司会被重新估值。
Google 之前一度将要收购 Windsurf ,结果最后只收购了它的员工,我觉得这可能是一部败棋,让人不得不怀疑现在 Gemini 在 agent coding 领域的拉垮是不是因为缺少真实用户编程的工作流数据来 RL 导致的(特别是很多测评都说 Gemini 的世界知识不错,这说明它的基模肯定是不差的)。

应用入口, 工作流, 数据

XTTX   
哪个工作流是只有微软能做,其他 codex,claude code app 这种 AI agent 干不了的? google\mis 这种巨头干不过 A 也干不过 O ,连 Cursor 干不过。 公司花巨量精力在“安全”和“合规”上面,天然地劣势。
defaw   
我看到了巨大风险,如果 openai 证明不了自己的稀缺性,只要靠后训练就能做出 gpt5.5 的话,纳斯达克就要完蛋了,懂王早就预料到这一步了吗,派马斯克去收购 cursor 然后干崩纳斯达克完成抄底和卸任。
ryougifujino
OP
  
@XTTX 没说只有微软能做,微软各方面都是 Cursor 的 pro max 版,只是认为它有这方面的潜力
ryougifujino
OP
  
@defaw 确实有这方面的风险,但 OpenAI 的目标应该是 Fable 5 ,这方面光靠后训练应该远远不够
您需要登录后才可以回帖 登录 | 立即注册

返回顶部