【自部署】TTS文本转语音大模型（docker一键使用） ...

马上国庆节了，写了个小玩具给大伙耍耍。
众所周知，阿里开源的Cosyvoice文本转语音大模型的效果非常的不错，
我也把玩了很久
但苦于没有高性能的显卡（租的卡总有一种紧迫感，用得不舒坦  ），所以写了个纯CPU运行的版本。
相较于官方原版：
CPU推理时原版精简后
内存占用 4G+ 4G+
硬盘占用 20G+ 8.93G
速度相同 50s/it 50s/it
对于原版，做了以下处理：
1. 剔除不必要的Python环境依赖和模型文件，硬盘占用减少10G
2. 基于python:3.10-slim镜像（裸镜像仅43M大小），并且使用Docker打包，系统更轻量的同时，不会遇到安装报错、版本不兼容、网络错误等等等等问题，小白也能轻松部署。
3. 重写了WebUI，（原版UI仅供测试使用，并且解决了第一次生成时，无法获取音频的问题），步骤指导更清晰！
硬件要求：
- 物理内存推荐 8G，加swap缓存也能跑，但是慢。
- 硬盘剩余空间大于 10G
- 流量消耗大约 10G
- CPU在推理时，会满载95%+（注意vps商家有无限制）
好了，说了那么多，下面就是详细步骤了：
第一步：将下面内容保存为docker-compose.yml
[ol]services:
  cov:
image: eureka6688/cosyvoice
container_name: cov
ports:
   - "50000:50000"
command: ["python", "web.py", "--port", "50000"]
stdin_open: true
tty: true
restart: unless-stopped[/ol]复制代码
第二步：在保存docker-compose.yml的目录下运行以下命令
[ol]docker compose up -d[/ol]复制代码
等待10分钟，也许更久，就能够在 http://localhost:50000 访问到web服务界面了
没错，就这么简单！
接下来用nginx反代使用也好，ssh隧道转发到本地使用也可以，甚至可以直接打开防火墙50000端口，再通过公网IP+50000端口访问都没问题（注意网络安全！）

原版, 写了, 也能

【自部署】TTS文本转语音大模型（docker一键使用）

相关帖子

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则