DeepSeek-V3.2-Exp模型正式发布并开源

查看 10|回复 1
作者:乔布斯   
9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏Attention架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台MaaS,针对DeepSeek-V3.2-Exp模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。DeepSeek介绍,得益于新模型服务成本的大幅降低,官方API价格也相应下调,新价格即刻生效。在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。

模型, 华为

zhujibcom   
DeepSee真是爱国 基本上每次发布在特别的日子里
您需要登录后才可以回帖 登录 | 立即注册

返回顶部