最重要的是,它可以根据我选中的上下文来增强识别的结果。就算是一些特殊名词,比如说 V2EX ,初音未来,哈次捏米库,它都可以很好地识别出来。
demo 视频(有剪辑): https://yongyuancv.cn/ipfs/Qmbitjuouf7ZsbPeneFZK5v8bv8ZXhPnzLcJ4EymZfJnk9?filename=1.webm
脚本(只支持 Linux 和 Mac ): https://yongyuancv.cn/ipfs/QmWTh8PYDN8ebpfGe2i79NdHJjHhPYN72NNVg6L4ecRj4w?fileanme=voice-typing.sh
whisper 可以用官方的也可以本地自建 API https://github.com/heimoshuiyu/whisper-fastapi