公司想搞本地化算力部署 deepseek coder v2 给技术用,听到 AMD 锐龙 AI Halo 也不算贵,可行么

查看 71|回复 9
作者:cheman   
AMD 锐龙 AI Halo 2.7w rmb ,现在每月花在 token 上的钱其实感觉是蛮多的,有这样的一个方向性的想法,不知道会有什么坑,或者问题,有人懂么,专业点的看法。

算力, 本地化, 部署

afkool   
要是我的公司就公司自己开 pro20 。。
javalaw2010   
按照现在的说法,这玩意儿是上古模型了吧,部署这玩意儿干啥,形成不了生产力的话不就是在浪费钱吗
xtreme1   
halo 主要是算力低 encode prefill 都很慢
其次也没涨到这么贵
这个规模的模型能不能满足你需求, 可以先租赁个云算力试一下
sentinelK   
1 、这个模型真的能符合你的需求吗?
2 、这个设备是统一内存,所以速度非常感人。你能忍受你每轮对话 1 分钟 AI 才吐字,10 分钟给你改一行代码吗?如果能忍你就可以冲。
zhangaugust   
这模型也太老了吧
ntdll   
你先买 100 块钱的这个模型 API ,给你的技术用一下,然后听听他的反馈,你就知道答案了。如果你都找不到这个模型的购买,那么答案你应该也已经知道了。
cheman
OP
  
@javalaw2010 谢谢解答。感觉 deepseek v4 pro 好像不太现实,或者 部署 deepseek v4 flash 比 deepseek coder v2 更好?或者有什么更好的模型推荐或者硬件搭配方案?
cheman
OP
  
@ntdll 谢谢解答。
op351   
现阶段本地部署除了能保证 100%数据隐私合规可控,有什么其他优势?  
而且真要合规的话和国内算力或者模型提供商签正规合同就好了,写好条款保证不收集任何数据。
您需要登录后才可以回帖 登录 | 立即注册

返回顶部