llama 3 发布了，我感觉挺猛的...

我用 ollama 本地玩了一下 llama 3 8b (ollama 支持的也太快了...这才多久啊)
英文的话我觉得挺猛的... 回答的很漂亮，很明显比 mistral 7b 要强了，我试了几下也没什么问题，不过我测试的都是一些简单的问答，重点还是 rag, 使用工具和 agents 之类的。还记得去年玩 llama2 13b 时感觉那玩意儿挺傻的，后面还被 mistral 吊锤了，所以这次出 llama 3 的时候我还有些不屑一顾...
lmsys 的 chatbot arena 中，llama 3 8b instruct 也干掉了 mistral medium, mixtral 8x7b, command R 35B ，还有 chatGPT 3.5 之类的模型(存疑)，不过毕竟刚出，只有 1000 多张投票(其他模型基本都有个几万张票)，结果还不准，要等排名稳定，但我目前感觉这玩意儿在 7b-13b 甚至是 30b 的赛道真的好像还不赖。
考虑 llama 2 在开源社区巨大的影响力，考虑到有非常多模型都是基于 llama2 做的微调，很期待之后开源社区都能调出什么东西 (nsfw 咳咳咳咳咳咳)
当然这东西应该没有支持中文，我测试了一下，中文翻译完全不行，用中文提问也会用英文答，很明显没有针对中文做训练。能理解中文怕不是语料库混了点中文吧... 真的要用中文肯定还得等中文的微调。(我其实不太懂那些用中文测试不支持中文的模型的家伙...)
如果你想玩玩看的话，这里有几种方法:
meta ai

meta 这次搞了个自己的聊天页面 (不过不知道具体用的是哪一个模型... 还有不知名的图像生成模型)

chatbot arena

去 lmsys 投票吧

ollama

一行命令在命令行下载并运行 llm ，现已支持 llama 3

自己想办法

这里是官方 repo ，你自己想办法吧。https://github.com/meta-llama/llama3

llama 3 发布了，我感觉挺猛的...

浏览过的版块

热门主题

iPhone 18 基础款感觉不太会涨价

Quantumult X 规则使用疑问

抖音的缓存，是个***设计的吧。

Codeberg 宕机 7 个小时后，目前部分服务正

豆包做图还是很强的，千问不行

大模型时代，学新知识的迷茫问题

自己做中转站遇到的坑总结

上班上的自我怀疑了

一图读懂 DMIT 正价机（更新 dmit 应对鸡荒

笑不活了，你们网站遇到过这种情况嘛？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

llama 3 发布了，我感觉挺猛的...

浏览过的版块

热门主题

iPhone 18 基础款感觉不太会涨价

Quantumult X 规则使用疑问

抖音的缓存，是个***设计的吧。

Codeberg 宕机 7 个小时后，目前部分服务正

豆包做图还是很强的，千问不行

大模型时代，学新知识的迷茫问题

自己做中转站遇到的坑总结

上班上的自我怀疑了

一图读懂 DMIT 正价机（更新 dmit 应对鸡荒

笑不活了，你们网站遇到过这种情况嘛？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

在 Yoo趣儿投放广告