星火认知、文心一言、ChatGPT 哪个强?简单测了一下。

查看 60|回复 2
作者:RiverMud   
按照微博阑夕设计的问题问了一下星火认知、文心一言和 gpt3.5 模型的 ChatGPT 。
懒得打字了,所以只问了前六个问题。星火认知答对 4 个,文心一言答对 1 个,gtp3.5 模型的 ChatGPT 答对 4 个。gpt4 没有就没测,哪位试试?
问题连接: https://video.weibo.com/show?fid=1034:4889999422980118
这些问题以及测试方法并不一定科学、严谨,结果仅供诸君参考。
另外,一个刚推出的中文通用大模型综合性基准 SuperCLUE 认为星火认知仅次于 gpt3.5 和 gpt4 。
项目地址: https://github.com/CLUEbenchmark/SuperCLUE
这算不算科大讯飞的利好,是不是可以满仓 002230 了?
以上内容均为对客观过程及现实的描述,不代表个人认同方法、结果及排名,也不构成任何投资建议,投资者盈亏自负,本人不承担任何直接及连带责任,股市有风险,入市需谨慎。

星火, chatgpt, 答对, 文心

dunizb   
国内的还不都是半斤八两不相上下,不会有特别强的
air00dd   
样本太小、样本分布范围也不一定多科学,参考价值不大。
而且 GPT 是不断迭代的,训练模型是人为操控的容易加私货,像手机厂商特意为“跑分”做优化也说不定😏,或者勾结评测人员
您需要登录后才可以回帖 登录 | 立即注册

返回顶部