Cursor 审计发现: AI 编程基准测试成绩大部分是"作弊"来的, Opus 4.8 有 63% 的解法是抄的

查看 133|回复 12
Lin0936   
但是人类写代码也会去 github stackoverflow 上抄抄
deplives   
难道人类学知识不是抄吗?
indexError   
我一直觉得那些厉害的编码模型首先模型确实能理清那么大的数据量,最重要的服务器上还有一套系统来帮助他解决问题,类似于在用户端调用 edit grep tool 一样。那些降智啥的有可能就是服务器上这套系统在维护
您需要登录后才可以回帖 登录 | 立即注册

返回顶部