所以退而求其次,走云端方案。但现有方案基本都要你手动按快捷键开始/停止,或者用系统级方案加外部脚本,体验很割裂。
后来想了想,不如自己写一个 Fcitx5 的插件:fcitx5-voice-input
核心思路就三个:
[ol]
[/ol]
云端识别的好处就是本地几乎零开销,16G 轻薄本完全无感。
写完了装到 Arch 上用了几天,几个实际感受:
README 写了详细配置和构建步骤: https://github.com/devcxl/fcitx5-voice-input
有啥建议或者 bug 直接提 issue ,目前 MVP ,后续计划加本地 ASR 。

