@papa2 Voilà 主要是引擎能挑——主力 Soniox ,多语种混说不用切语言,还能传 context 把术语喂进去,识别精度直接上一档。要离线就 Apple Speech 本地,火山/ElevenLabs 也接了:)适合各种场景使用。主要打的就是用起来舒服,现在就是一个每天使用的一个小工具了。
@qfdk #78 开启和配置了 ai 润色后,实测完全看不出效果,不清楚问题在哪里,去掉语气词的功能对我来说没有意义,因为很多口癖不用 ai 润色是无法解决的 我在口述之后会阅读下生成的内容,结构化的内容可以方便我验证,因为我经常会说挺长的大段的 对我来说目前是不如闪电说的,但闪电说的词典功能经常不生效,不清楚原因,除此以外都挺好