🎙️ MaxSpeak — 开源免费的 AI 语音合成工作台, 300+ 音色 / 音色复刻 / 音色设计 MINIMAX 接口

查看 20|回复 2
作者:HarlanZhang   

🎙️ MaxSpeak — AI 语音合成工作台

免费 · 开源 · 300+ 音色 · 音色复刻 · 音色设计

🔗 在线体验: https://maxspeak.vercel.app
📦 GitHub: https://github.com/harlan-zhang/maxspeak
这是什么?
一个基于 MiniMax 语音大模型的全栈 TTS 工具,浏览器打开即用。
能做什么?
  • AI 语音合成 — 文本转语音,9 种情感风格(开心/悲伤/愤怒/耳语…)、语速/音高精细调控、22 种副语言标签(叹气/笑声/呼吸…)
  • 音色复刻 — 上传 10 秒音频即可克隆任意音色,适合播客、有声书、无障碍场景
  • 音色设计 — 用自然语言描述想要的音色,AI 即时生成("温暖亲切的女声,适合读睡前故事")
  • 流式播放 — SSE 流式输出实现边生成边播放,长文本自动切换流式
  • 300+ 预置音色 — 中英日韩粤 + 西葡法德俄等 20+ 语言

    技术栈
    Next.js 14 + TypeScript + Tailwind CSS + Zustand + Web Audio API
    为什么开源?
    MiniMax 的 API 能力很强但缺少一个好用的前端。这个工具把复杂的 API 参数(情感控制、副语言标签、音色修饰、发音词典…)全部做成了可视化界面,降低使用门槛。
    关于 API Key
    应用本身不要钱,语音合成走 MiniMax API 按量计费(约 ¥2-3.5/万字符)。API Key 只存浏览器本地,不经过任何第三方服务器。
    部署
    如果想自己部署,点一下就行:

    欢迎试用,有任何建议或 bug 直接提 Issue 🙏

    语音合成, 开源, 音色

  • HarlanZhang
    OP
      
    Graceful Lady 那个预设有点感觉 英伦女声

    YAFEIML   
    送个 star
    您需要登录后才可以回帖 登录 | 立即注册

    返回顶部