Yoo趣儿 › 探索分享 › 分享发现 › 星火认知、文心一言、ChatGPT 哪个强？简单测了一下。 ...

星火认知、文心一言、ChatGPT 哪个强？简单测了一下。

查看 231|回复 2

作者：RiverMud 发布时间：2023-5-10 07:35:13

按照微博阑夕设计的问题问了一下星火认知、文心一言和 gpt3.5 模型的 ChatGPT 。
懒得打字了，所以只问了前六个问题。星火认知答对 4 个，文心一言答对 1 个，gtp3.5 模型的 ChatGPT 答对 4 个。gpt4 没有就没测，哪位试试？
问题连接： https://video.weibo.com/show?fid=1034:4889999422980118
这些问题以及测试方法并不一定科学、严谨，结果仅供诸君参考。
另外，一个刚推出的中文通用大模型综合性基准 SuperCLUE 认为星火认知仅次于 gpt3.5 和 gpt4 。
项目地址： https://github.com/CLUEbenchmark/SuperCLUE
这算不算科大讯飞的利好，是不是可以满仓 002230 了？
以上内容均为对客观过程及现实的描述，不代表个人认同方法、结果及排名，也不构成任何投资建议，投资者盈亏自负，本人不承担任何直接及连带责任，股市有风险，入市需谨慎。

星火, chatgpt, 答对, 文心

相关帖子

dunizb 2023-5-10 07:35:58

国内的还不都是半斤八两不相上下，不会有特别强的

air00dd 2023-5-10 07:36:38

样本太小、样本分布范围也不一定多科学，参考价值不大。
而且 GPT 是不断迭代的，训练模型是人为操控的容易加私货，像手机厂商特意为“跑分”做优化也说不定😏，或者勾结评测人员

返回列表

公告

返回顶部

星火认知、文心一言、ChatGPT 哪个强？简单测了一下。

相关帖子

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

星火认知、文心一言、ChatGPT 哪个强？简单测了一下。

相关帖子

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告