支持语言:中文、英文、日文、韩文、中国方言(粤语、四川话、上海话、天津话、武汉话等)
双向流式支持:CosyVoice 2.0集成了离线和流式建模技术。
快速首包合成:在保持高质量音频输出的同时,将延迟降低至150毫秒。
[color=]系统要求:win10 64位,16G内存,显卡:N卡不低于6G
[color=]在模型管理里面可以自定义添加需要克隆的声音

image.png (163.49 KB, 下载次数: 0)
下载附件
2025-6-10 22:35 上传

image.png (177.65 KB, 下载次数: 0)
下载附件
2025-6-10 22:36 上传

image.png (35.79 KB, 下载次数: 0)
下载附件
2025-6-10 22:50 上传
[color=]解压后的文件:15.6G
开源地址:https://github.com/FunAudioLLM/CosyVoice
整合包链接:https://pan.quark.cn/s/8d5e5b6c09b5