的文字转语音的工具,内置多语种多声音角色,可将任意文字内容转换为流畅的语音文件,完全调用微软及edge公共API接口,
[color=]纯CPU处理
,适用于譬如短视频配音、教学平台、有声读书等各种应用场景。如侵请删~~~
虽然这类软件多的是,尤其是在线网页版确实不计其数,
[color=]缺点都是限制字数的居多
,不排除要登录及限制次数的可能。另外,某些真人克l类TTS也相当成熟,无奈老旧系统无缘,但这些均不在本帖讨论及推荐范围之内。
而此款并无以上束缚,u1s1这么多厂商的TTS当中唯有微软TTS的声音合成算是yyds,简洁而无登录接口,不限次数不限字数,实现不失真全输出,支持 win 7 – 11 64位系统 。
近期更新,有需自取~~~
软件特点:
1. 支持导入txt、srt字幕文件;
2. 实现音频文件管理,方便反复试听和对比;
3. 现可自选音频保存目录;
4. 保留超长文本转录的可行性;
5. 文件重命名不再受软件影响。
使用说明:
单文件版即开即用即删,ctrl + v 粘贴对应的文字,合成语音成功后会自动弹出输出的音频结果。常用语种识别包括但不限于普通话、粤语、港普、台语、日韩马来等等,前提是部分外语文字要相应匹配。所以一般而言公共接口已经可以满足日常的转录使用了。文本越长,合成处理自然越久。
若是使用 win 7 及精简版系统,需到微软官方安装 > > Webview2 依赖环境才能玩。不排除可能还需要常用C++运行库的加持,论坛多的是,善用搜索功能便能找到。
另外,如果想要更多语种识别多角色演绎且会折腾的,则需自行到 > > 微软Azure 申请免费api自行导入,教程在小破站随处可见,具体自行搜索即可。 况且可直接录制对应的报时声音,可用于某些语音报时工具,如 > > 自动化任务工具(选定“报时”任务,音频默认放在对应的Data——Sound目录文件夹内,直接对应替换原始音频的文件命名及格式)
*已测win 11 平台可正常转录3万+ 文字章节无异常(极限字数则请自行测试),可下载并成功输出约1个半钟的音频文件。如下↓
PS:
1.已测火绒无拦截,请戳 > > 查杀结果 。若担心的请扔至虚拟环境当中运行,介意的则勿下勿用,嫌弃的推荐直接del删除。
2.文本内容不得含有特殊符号或表情字符,如井号、星号又或者表情式符号之类的,否则可能提示合成失败。但由于公共接口受网络服务器影响,不排除可能滥用导致偶尔抽风的问题。。。
支持语种:(仅对默认而言)
sshot-20241125-193128-small.png (173.92 KB, 下载次数: 0)
下载附件
2024-11-26 01:59 上传
主要界面:(文本导入及音频输出)
sshot-20241125-194102-small.png (255.93 KB, 下载次数: 0)
下载附件
2024-11-26 01:59 上传
sshot-20241125-194156-small.png (25.85 KB, 下载次数: 0)
下载附件
2024-11-26 01:59 上传
导入文件界面:(可Ctrl+ A全选copy到主界面使用)
sshot-20241125-195246-small.png (63.11 KB, 下载次数: 0)
下载附件
2024-11-26 01:59 上传
下载地址:
1 > > 蓝盘下载 密码:52pj
2 > > 备份盘下载 密码:52pj