技术上用了 moviepy+ChatTTS 。 效果见: https://www.bilibili.com/video/BV1Er421F76v/ 目前遇到的问题: [ol]ChatTTS 不能很好地维持音色。ChatTTS 不能控制情感色彩,有时候和台词对不上。ChatTTS 对短句的处理比较糟糕,有时候会吞字。ChatTTS 会读错多音字。让 ChatTTS 自己refine_text会出来一些乱七八糟的,比如吞掉一个字、在中文里放入无关的英文等等。ChatTTS 有时候听着像是在唱歌,有时候会出现奇怪的噪音。 [/ol] 生成视频的脚本暂不开源,避免被某些 up 用于不当牟利、网暴、人身威胁、性骚扰(也就是我最近八年的长期遭遇)。如果你有自己的译稿的话可以找我跑脚本生成视频。