各位的 m4 设备都陆续到货了，能否跑一下 ollama/llama.cpp ，看看大模型这块的算力究竟比 m1 max m2 ultra ，提升有多少？

查看 307|回复 10

作者：beginor 发布时间：2024-11-8 22:02:59

跑不太大的模型，比如 Llama 3.1 8B
https://huggingface.co/lmstudio-community/Meta-Llama-3.1-8B-Instruct-GGUF/blob/main/Meta-Llama-3.1-8B-Instruct-Q8_0.gguf
这个模型 16G 内存的丐版也能跑起来。

berchtesgaden 2024-11-8 22:03:38

https://www.bilibili.com/video/BV1PdDSYjEEW

234ygg 2024-11-8 22:04:28

本地跑的全是弱智模型。。做个翻译都嫌蠢
第三方 gpt api 还不够便宜？

Tubbs 2024-11-8 22:05:00

@234ygg 并不是这样的，体验一下 qwen2.5 32b 的量化模型，本地可以跑，评测水平和 gpt-4o-mini 差不多水准了，日常用起来感觉也是不错的

lrigi 2024-11-8 22:05:55

@234ygg llama3.2 弱智？你太逗了，跟不上时代了已经

slayer 2024-11-8 22:06:30

@berchtesgaden #1 这个不错，现在 mac 应该在 lm studio 下跑了转换的 mlx 模型，貌似 ollama 还不支持 mlx 格式的。

Gotchaaa 2024-11-8 22:07:25

我 M1 pro 都能跑

piero66 2024-11-8 22:07:56

8b 太蠢了

shinecurve 2024-11-8 22:08:56

原本计划买 M4 Max + 128G 跑 ollama 的，后来从 llama 70b 的能力、算力成本和实际应用场景考虑我最终放弃了，感觉还需在在等两年，我认为目前最好的选择还是 ChatGPT 。
希望对你能有些帮助。

234ygg 2024-11-8 22:09:31

我已经懒得试了，最后一次跑本地模型是几个月前 gemini27b ，远不及 gpt3.5 ，勉强能干个不涉及较多专业词汇的简单翻译，功耗在我的 4090 上高达 250W 。。但凡问点其他问题，我都不说回答的对不对了，甚至不能持续稳定保持中文回答。再早几个月的 llama3 更是一坨。
llama3.2 11b 充其量也就那点水平，合理推断也是个弱智
gpt4o 的 apt 都那么便宜了，更不要说 3.5 了，不要骗我浪费电听显卡电感箫叫了

各位的 m4 设备都陆续到货了，能否跑一下 ollama/llama.cpp ，看看大模型这块的算力究竟比 m1 max m2 ultra ，提升有多少？

浏览过的版块

热门主题

问大家一个问题，双十一买东西真的比平时有

阿里云搞活动的服务器，买错了可以退款吗

服务器降价，我就难过！

大A今天这么猛，大家都赚了吗

腾讯云周四秒杀，海外2C2G30M，老用户可以

节后第一天上班建议适度摸鱼

OpenAI 计划将 ChatGPT 打造成全新操作系统

景区禁止游客手持枫叶捡也不行

智利一公司错发330倍月薪后员工失联

辽宁老边沟禁止游客捡枫叶景区回应

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

各位的 m4 设备都陆续到货了，能否跑一下 ollama/llama.cpp ，看看大模型这块的算力究竟比 m1 max m2 ultra ， 提升有多少？

浏览过的版块

热门主题

问大家一个问题，双十一买东西真的比平时有

阿里云搞活动的服务器，买错了可以退款吗

服务器降价，我就难过！

大A今天这么猛，大家都赚了吗

腾讯云周四秒杀，海外2C2G30M，老用户可以

节后第一天上班建议适度摸鱼

OpenAI 计划将 ChatGPT 打造成全新操作系统

景区禁止游客手持枫叶 捡也不行

智利一公司错发330倍月薪后员工失联

辽宁老边沟禁止游客捡枫叶 景区回应

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

各位的 m4 设备都陆续到货了，能否跑一下 ollama/llama.cpp ，看看大模型这块的算力究竟比 m1 max m2 ultra ，提升有多少？

景区禁止游客手持枫叶捡也不行

辽宁老边沟禁止游客捡枫叶景区回应

在 Yoo趣儿投放广告