目前我已知的 ai 排行榜, 那个是更可信的, 国内 ai 哪个是体验接近的

查看 88|回复 4

作者：dwhh 发布时间：2026-4-3 21:39:31

https://artificialanalysis.ai/leaderboards/models
https://livebench.ai/#/?highunseenbias=true
https://www.superclueai.com/generalpage
ai 排行与对比
https://arena.ai/text
经评论区提醒加:
https://vercel.com/ai-gateway/leaderboards


      第 2 条附言  ·  59 分钟前


      (arena)用一段简单代码对比测试(prompt 由 claude opus 生成, 不完全测试), 简单评价(模型均为最新最好)一下:
顶级: claude > chatgpt
优等: gemini > grok
对比 1: glm-5 > qwen
对比 2: kimi > longcat mimo
劣等: 豆包, deepseek, minimax, ernie
推荐使用方式:
关注模型评测网站, 选择表现好的实际网站, 在实际网站上选择表现好的最新最好模型, 不要使用快速模式.
生活化选择手机的语音 ai 或者豆包/品牌自带, 工作用顶级优等模型, 学习用优等及国产顶级模型, 龙虾关注次等模型厂商的 coding plan, 不要关注过于小众表现差的模型.

avenger 2026-4-3 21:40:08

经评论区提醒加:
https://vercel.com/ai-gateway/leaderboards

kuhung 2026-4-3 21:40:53

(arena)用一段简单代码对比测试(prompt 由 claude opus 生成, 不完全测试), 简单评价(模型均为最新最好)一下:
顶级: claude > chatgpt
优等: gemini > grok
对比 1: glm-5 > qwen
对比 2: kimi > longcat mimo
劣等: 豆包, deepseek, minimax, ernie
推荐使用方式:
关注模型评测网站, 选择表现好的实际网站, 在实际网站上选择表现好的最新最好模型, 不要使用快速模式.
生活化选择手机的语音 ai 或者豆包/品牌自带, 工作用顶级优等模型, 学习用优等及国产顶级模型, 龙虾关注次等模型厂商的 coding plan, 不要关注过于小众表现差的模型.

avenger 2026-4-3 21:41:27

这个也可以参考
https://vercel.com/ai-gateway/leaderboards

kuhung 2026-4-3 21:42:15

我认为 arena 的主观打分盲测更靠谱只要有排行，就免不了那啥
要不就是使用主流最新模型，其他的看看就得了

目前我已知的 ai 排行榜, 那个是更可信的, 国内 ai 哪个是体验接近的

浏览过的版块

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

目前我已知的 ai 排行榜, 那个是更可信的, 国内 ai 哪个是体验接近的

浏览过的版块

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告