加上好的 prompt, 加上好的 instructions, 大模型之间从差距会缩小一些,尤其是好的 prompt 影响较大. 如果就是"一句话需求",那真得 Claude ,基本是遥遥领先的. 第二梯队的是 Grok@latest , Gemini@latest, ChatGpt@ latest. 国内产品基本是瘫子里面找瘸子,排序是豆包,千问,其他的都垃圾,无一例外.