有很多场景,需要通过测试问题,推测模型。 之前有朋友说,可以问:树上有 9 只鸟,猎人开枪打死一只,树上还剩下多少只鸟? 但是我试了 5 次,GPT 3.5 才答错一次。 你还知道什么其他的问题可以测试?