未来大模型硬件成本下降 5-10 倍,我们的未来会是什么样的?

查看 74|回复 7
作者:LeeReamond   
说实话最近工作没有太多需求,空下一些时间深夜做一些无所谓的瞎想
众所周知的是,2023 年 gpt3 刚出来的时候大家可不像今天这么感觉大模型能完美替代几乎所有程序员工作。而 2023 年到现在也不过 3 年。那么,如果再把时间维度拉长到 3-5 年,我们的未来会是什么形态?
已知前提
[ol]
  • 模型的提升本质上实际上是信息密度提升,存在边际效应,但是从 2026 回看过去三年,已经提升很多,未来仍有一定提升空间。
  • nvdia 的硬件是存在高溢价的,仅从成熟制程集成电路技术的角度来说计算成本没有现在这么贵。
    [/ol]
    与大模型聊天后做出的推断性判断
    [ol]
  • 已知过去三年间低端模型(个人用户的消费级硬件有潜在希望能运行的模型,例如 64B 及以下模型)的部署成本大概降低了 1000 倍。
  • 高端模型( 1-1.5T 参数)所依赖的部署设备的成本,如果能够去掉类似 cuda 护城河和 nv 溢价的话,未来也不会下降太多,但是下降 5 倍是可能的(也就是说类似于企业部署满血 deepseek v4 pro ,目前的成本比如是 300 万一台机器的话,未来理想情况下可能降低至 60 万,应该不会再低了)
  • 目前看来可能的提升模型能力的方向,例如多 agent 任务流,消耗 token 数量大概是普通对话的 10 倍左右。
  • 以当下的重度 LLM 用户的使用习惯来看(考虑人机交互中人类心智端的极限),取决于任务的不同,每天生成 token 数大概在 1M-100M 之间。
    [/ol]
    那么综合推断下来 3-5 年后的未来会存在这样一批人
    [ol]
  • 每天使用大模型综合 token 输出数量在 10M-1000M 之间。
  • 使用多 agent 执行各种复杂任务
  • 使用次旗舰级别开源模型,能力超过或与当下的旗舰模型持平(假设与 Fable5 持平)
  • 每 1Mtoken 的输出成本,按现在的购买力计算,约与当下的 deepseek 官方 api 价格持平( 3-6 元每 M )
  • 也就是未来会存在一些每天花费大约一百-几百到 1-2 千元 token 成本,生产效率约等于无限制使用现在的 claude Fable5 模型进行各类工作(很可能是多模态工作)的这么一些人。
    [/ol]
    所以未来编程行业会是什么样呢?未来各行各业会是什么样呢?大厂工作的人我感觉未来 5 年应该都能做到上述推断的程度,大厂的生产力会前所未有的蓬勃,个人工作者市场应该会完全消失。其他所有从事文创、生产类工作的工作者,比如在起点写小说的,可能会有 fable5 帮忙连续不断地 24 小时推演。

    大模型, 未来, 生产力

  • LeeReamond
    OP
      
    大概四五年前,程序员开发副业还有通过类似个人编程能力,实现潜在财富自由的指望(比如开发一款好用的 app )。当年站内比较火的有类似于记账软件产品被大厂抄袭之类的事发生。那么随着现在大厂生产力越来越蓬勃,以后这些中小软件 app 开发致富的路子应该完全不会有市场?中小厂商都要倒闭?
    trn4   
    你这话仿佛是在上个世纪内存还是 640KB 的时候问:”未来内存涨到 8MB 了会是什么样子?“。安迪比尔定律告诉你了,硬件再强都会有更强的模型把他耗尽。你的硬件永远不够。
    trn4   
    @trn4 #2 简单来说就是 AI 工作流消耗越来越高,高端模型依旧高质高价拿走大部分利润,低端进入价格战普及模式。计算机发展史已经走过一次了。
    LeeReamond
    OP
      
    @trn4 我是站在历史潮流里一个渺小的人,如果我生活在 1990 ,我想知道人均内存 1G 的时代是什么样子,4G 的时代是什么样子,64G 的时代是什么样子。高端模型的高质高价我倒感觉边际效应越来越明显了,模型不断地变聪明,但是又能聪明到哪里去呢?硬件成本下降和服务竞争红海化我倒感觉你说的低端价格战普及会带来的影响更大一些
    xlxx   
    🎅有可能能把软件外包价格打下来?
    tywtyw2002   
    @LeeReamond 有些基础理论,你可以问问 AI 去了解下。
    对于内存 cpu 的例子,针对大型企业用户的例子是成本指数级下降。
    以前大型运算要 openmp ,并且不便宜。2012 年左右成本就已经可控了,不需要搞一机房服务器就能算了,一机柜足以。然后 2018 年,一台服务器对于很多计算都足够了。然后就没人搞服务器了,直接 aws 算了。
    ai 基础算法 1990 年代就以及有了。剩下的就是算力。
    LeeReamond
    OP
      
    @tywtyw2002 我觉得倒不用说 bp 在多少年前就有了这种废话。至于企业级内存 cpu 成本下降的例子,你看 cuda 都是一个多少年的产品了,到现在科学计算还是这套东西,它的成本下降会继续走以前的路子吗? 6 年时间里从一个机房缩减到一台单机?我不看好。
    您需要登录后才可以回帖 登录 | 立即注册

    返回顶部