发现使用 stream 模式能非常快的响应结果. 但是如果直接使用 gpt3.5-turbo 模式的话, 每个问题的答案生成需要 20s 左右。 不知道大家有什么好办法么? 目前使用了新加坡机场 和 aws 日本节点, 都非常的慢。 GPT, AWS, openai, stream