未来大模型硬件成本下降 5-10 倍，我们的未来会是什么样 ...

作者：LeeReamond 发布时间：2026-6-16 04:06:23

说实话最近工作没有太多需求，空下一些时间深夜做一些无所谓的瞎想。
众所周知的是，2023 年 gpt3 刚出来的时候大家可不像今天这么感觉大模型能完美替代几乎所有程序员工作。而 2023 年到现在也不过 3 年。那么，如果再把时间维度拉长到 3-5 年，我们的未来会是什么形态？
已知前提：
[ol]

模型的提升本质上实际上是信息密度提升，存在边际效应，但是从 2026 回看过去三年，已经提升很多，未来仍有一定提升空间。

nvdia 的硬件是存在高溢价的，仅从成熟制程集成电路技术的角度来说计算成本没有现在这么贵。
[/ol]
与大模型聊天后做出的推断性判断：
[ol]

已知过去三年间低端模型（个人用户的消费级硬件有潜在希望能运行的模型，例如 64B 及以下模型）的部署成本大概降低了 1000 倍。

高端模型（ 1-1.5T 参数）所依赖的部署设备的成本，如果能够去掉类似 cuda 护城河和 nv 溢价的话，未来也不会下降太多，但是下降 5 倍是可能的（也就是说类似于企业部署满血 deepseek v4 pro ，目前的成本比如是 300 万一台机器的话，未来理想情况下可能降低至 60 万，应该不会再低了）

目前看来可能的提升模型能力的方向，例如多 agent 任务流，消耗 token 数量大概是普通对话的 10 倍左右。

以当下的重度 LLM 用户的使用习惯来看（考虑人机交互中人类心智端的极限），取决于任务的不同，每天生成 token 数大概在 1M-100M 之间。
[/ol]
那么综合推断下来 3-5 年后的未来会存在这样一批人：
[ol]

每天使用大模型综合 token 输出数量在 10M-1000M 之间。

使用多 agent 执行各种复杂任务

使用次旗舰级别开源模型，能力超过或与当下的旗舰模型持平（假设与 Fable5 持平）

每 1Mtoken 的输出成本，按现在的购买力计算，约与当下的 deepseek 官方 api 价格持平（ 3-6 元每 M ）

也就是未来会存在一些每天花费大约一百-几百到 1-2 千元 token 成本，生产效率约等于无限制使用现在的 claude Fable5 模型进行各类工作（很可能是多模态工作）的这么一些人。
[/ol]
所以未来编程行业会是什么样呢？未来各行各业会是什么样呢？大厂工作的人我感觉未来 5 年应该都能做到上述推断的程度，大厂的生产力会前所未有的蓬勃，个人工作者市场应该会完全消失。其他所有从事文创、生产类工作的工作者，比如在起点写小说的，可能会有 fable5 帮忙连续不断地 24 小时推演。

大模型, 未来, 生产力

相关帖子

LeeReamond

OP

2026-6-16 04:07:09

大概四五年前，程序员开发副业还有通过类似个人编程能力，实现潜在财富自由的指望（比如开发一款好用的 app ）。当年站内比较火的有类似于记账软件产品被大厂抄袭之类的事发生。那么随着现在大厂生产力越来越蓬勃，以后这些中小软件 app 开发致富的路子应该完全不会有市场？中小厂商都要倒闭？

trn4 2026-6-16 04:07:44

你这话仿佛是在上个世纪内存还是 640KB 的时候问：”未来内存涨到 8MB 了会是什么样子？“。安迪比尔定律告诉你了，硬件再强都会有更强的模型把他耗尽。你的硬件永远不够。

trn4 2026-6-16 04:08:21

@trn4 #2 简单来说就是 AI 工作流消耗越来越高，高端模型依旧高质高价拿走大部分利润，低端进入价格战普及模式。计算机发展史已经走过一次了。

LeeReamond

OP

2026-6-16 04:09:11

@trn4 我是站在历史潮流里一个渺小的人，如果我生活在 1990 ，我想知道人均内存 1G 的时代是什么样子，4G 的时代是什么样子，64G 的时代是什么样子。高端模型的高质高价我倒感觉边际效应越来越明显了，模型不断地变聪明，但是又能聪明到哪里去呢？硬件成本下降和服务竞争红海化我倒感觉你说的低端价格战普及会带来的影响更大一些

xlxx 2026-6-16 04:09:58

🎅有可能能把软件外包价格打下来？

tywtyw2002 2026-6-16 04:10:37

@LeeReamond 有些基础理论，你可以问问 AI 去了解下。
对于内存 cpu 的例子，针对大型企业用户的例子是成本指数级下降。
以前大型运算要 openmp ，并且不便宜。2012 年左右成本就已经可控了，不需要搞一机房服务器就能算了，一机柜足以。然后 2018 年，一台服务器对于很多计算都足够了。然后就没人搞服务器了，直接 aws 算了。
ai 基础算法 1990 年代就以及有了。剩下的就是算力。

LeeReamond

OP

2026-6-16 04:11:20

@tywtyw2002 我觉得倒不用说 bp 在多少年前就有了这种废话。至于企业级内存 cpu 成本下降的例子，你看 cuda 都是一个多少年的产品了，到现在科学计算还是这套东西，它的成本下降会继续走以前的路子吗？ 6 年时间里从一个机房缩减到一台单机？我不看好。

未来大模型硬件成本下降 5-10 倍，我们的未来会是什么样的？

相关帖子

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

未来大模型硬件成本下降 5-10 倍，我们的未来会是什么样的？

相关帖子

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告