本地部署 DeepSeek-R1 671B 千亿大模型流程

查看 369|回复 18

snowkylin

2025-2-1 00:08:14

@vpsvps 我没试过直接用 ollama 下载，不太确定，以及这个是 unsloth ai 出的动态量化版本，目前我只看到 huggingface 上有

erek 2025-2-1 00:09:14

抱歉，一块显卡都没有 T T

uncat 2025-2-1 00:09:52

> 我的服务器有 8 块 4090 ，内存 640G ，能跑得动 671b 404GB 这个吗？
可以跑得动，跟你类似的配置，8 * 4090 + 512G 内存。Ollama 671B Q4 ，回答问题，短的 10s ，长的 20 - 30s 的样子。体验较差。
实际显存+内存总共：180 - 200G 。
ollama 现在会因为显存分配策略问题导致无法启动，需要 dump 出 Modefile 后手动添加 parameter num_gpu 为显卡数量 * 2

uncat 2025-2-1 00:10:37

@vpsvps

vpsvps 2025-2-1 00:11:33

@uncat 谢谢回复，是直接 ollama run deepseek-r1:671b 这个就行吗？这个简单些。huginnface 上的版本还得合并，比较麻烦，您说的是指用 unsloth/DeepSeek-R1-GGUF 这个模型文件吗

uncat 2025-2-1 00:12:17

> 是直接 ollama run deepseek-r1:671b 这个就行吗？
先 ollama pull deepseek-r1:671b 拉下来后，保存 modefile 到本地，添加 num_gpu 参数后再重新导入即可。
参考这个： https://github.com/ollama/ollama/issues/6950#issuecomment-2373663650
@vpsvps

uncat 2025-2-1 00:12:49

1. ollama pull deepseek-r1:671b
2. ollama show --modelfile deepseek-r1:671b | sed -e 's/^FROM.*/FROM deepseek-r1:671b/' > Modelfile
3. echo "PARAMETER num_gpu 0" >> Modelfile
4. ollama create deepseek-r1:671b-custom
第 3 步，将 0 替换为 2 （假设你是 24G 显存的显卡，实际显存除以 9 取整数商）

uncat 2025-2-1 00:13:29

@vpsvps

vpsvps 2025-2-1 00:14:28

@uncat 谢谢我试试

本地部署 DeepSeek-R1 671B 千亿大模型流程

热门主题

现在域名交易市场上什么样的域名值钱啊

测速网TV v4.1.7 支持TV/安卓

求4份pdf版的文献资料

知网下载求助：杂志《测绘科学》 2025年第

[资源求助] 求2025年下半年芝士架构【系统

百度网盘转夸克网盘！！

哪位大佬能帮我找这本书的PDF版？梅花医案-

NeeView(尼视图)_v44.1

@silartsua 大佬请进（其他帖子应助）

诚心求一本书PDF，新疆城市规划管理技术规

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

本地部署 DeepSeek-R1 671B 千亿大模型流程

热门主题

现在域名交易市场上什么样的域名值钱啊

测速网TV v4.1.7 支持TV/安卓

求4份pdf版的文献资料

知网下载求助 ：杂志《测绘科学》 2025年第

[资源求助] 求2025年下半年芝士架构【系统

百度网盘转夸克网盘！！

哪位大佬能帮我找这本书的PDF版？梅花医案-

NeeView(尼视图)_v44.1

@silartsua 大佬请进 （其他帖子应助）

诚心求一本书PDF，新疆城市规划管理技术规

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

知网下载求助：杂志《测绘科学》 2025年第

@silartsua 大佬请进（其他帖子应助）

在 Yoo趣儿投放广告