求助关于声音模型的问题！

查看 80|回复 0

作者：春天小雨发布时间：2025-9-20 06:40:41

最近在开发遇到需要使用声音克隆，然后调用克隆声音的问题。
目前我使用别人的整合包，都是没有API功能，要么就是整合包的调用响应不稳定，我需要响应快速一些的，最好小于1秒的，我查看很多AI直播数字人的都是可以上传一个.pt文件。
但是我始终没有找到这个方案，我使用了阿里的cosyvoice2与GPT-SoVITS发现都是一样，单音频生成没有问题，就是只能界面使用克隆声音，不能像AI一样创建模型，然后给到程序使用。
我想大佬有知道怎么可以处理吗？由于使用到的是克隆声音，并非简单的tts模型，这个方面接触的少，搜索关键词也没有搜索到，基本都是整合包，要么就是官网的代码，并且响应慢，需要在代码运行，一个包就7G-10G，很占用内存。

都是, 声音

公告

返回顶部

求助关于声音模型的问题！

相关帖子

热门主题

刚换了新主机，劳烦帮忙再测下速度，感谢~

经济大环境不好，我们小县城摆地摊的越来越

宝塔批量管理平台

这种域名怎么处理？能申诉吗？啥都没做提示

以后谁要给我发红包，那我就xxlb

腾讯云禁止国外注册的域名，你还会用吗

自制一个华为邮箱

戒酒成功，我打算做一个卖酒的B2B网站。

天涯复活了，西祠也复活了，谁还能回到当年

ename .net 注册30元，没找到喜欢的

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

求助关于声音模型的问题！

相关帖子

热门主题

刚换了新主机，劳烦帮忙再测下速度，感谢~

经济大环境不好，我们小县城摆地摊的越来越

宝塔批量管理平台

这种域名怎么处理？能申诉吗？啥都没做提示

以后谁要给我发红包，那我就xxlb

腾讯云禁止国外注册的域名，你还会用吗

自制一个华为邮箱

戒酒成功，我打算做一个卖酒的B2B网站。

天涯复活了，西祠也复活了，谁还能回到当年

ename .net 注册30元，没找到喜欢的

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

在 Yoo趣儿投放广告