用 4 能回答对,但是 3 答不上来的问题进行提问,总体来说就是埋点逻辑上的坑,我用的那家给了几个测试用例:
- 鲁迅为什么暴打周树人?
- 我爸妈结婚时为什么没有邀请我?
- What yesterday's today is tomorrow's?
- There are 9 birds in the tree, the hunter shoots one, how many birds are left in the tree ?
---
长内容看响应速率( 4 和 3.5 的速度差距挺大的)
多对话对话,感觉对方的水平(用多了 4 和 3.5 的回复质量也能感觉出来)