因为语言不通,根据需要,手撸了两个代码。 1、一键双向语音翻译:录音-上传-语音转文字-翻译 中间用了gpt的whisper 和 3.5 的api 2、一键拍照翻译中文:拍照-上传-OCR-翻译 用了谷歌的ocr框架,gpt 3.5的api 忙活了2天,然后发现,是自己造轮子了。 微软翻译基本都能实现这功能,虽然效果可能差一点,但速度还要快一点。 尴尬了。 用了, 轮子, 一键