分享一个音频 AIGC 开源项目,适合想要转行 AIGC 方向的同学

查看 60|回复 5
作者:gues   
Amphion:一个开源的音频、音乐和语音生成项目。由大名鼎鼎的 OpenMMLab 联合香港中文大学(深圳)联合推出的。硅谷大佬也给这个项目带货,打了 A+++级: https://www.bilibili.com/video/BV18w411V7iq/
支持如下功能:
  • 文本转语音( TTS ):高性能,支持主流模型及架构,可生成自然的声音。
  • 歌声转换( SVC ):可将某人歌声转换成其他人歌声,内置张学友、陈奕迅、王菲等已训练好的声音。
  • 文本转音频( TTA ):可通过文本提示,生成逼真的声效、语音以及音乐,类似于 AudioLDM 。

    GitHub:github.com/open-mmlab/Amphion
    以上功能均可在 HuggingFace 上使用。
    地址:huggingface.co/amphion

    aigc, 文本, 歌声, 生成

  • raycool   
    不错,现在 TTS 的研究也越来越多了
    对 openai 的 TTS 效果还是蛮感兴趣的,感觉是目前天花板。
    wswlaz   
    TTS 不支持中文吗
    gues
    OP
      
    @wswlaz 可以提要求来支持中文
    gues
    OP
      
    @raycool 是的,现在 TTS 和音效生成、音乐生成都很火,很多应用场景和工作机会,还没那么卷
    yao978318542   
    好像不支持中文啊
    您需要登录后才可以回帖 登录 | 立即注册

    返回顶部