如果你在做视频/播客/课程,配音是最耗时间的环节之一。我做了个 AnySpeech.io:把文字直接转更自然的配音,长文本也比较稳,适合批量内容生产。给你一个免费试用入口: https://anyspeech.io/ TTS, 稳定性
能解决长尾问题嘛? 比如有些特定领域的特定读法、特定分词(中文词组停顿),一旦做的不对或者不全对,就会被听众一眼识破,认为这个节目不是专业人士准备的。就跟雷总把他的宝贝芯片商品名 o1 念成 01 ,一样滑稽。