做了一个结合多种 AI 模型的一站式字幕平台，同时也提供 ...

分享一个我们正在做的产品--快转字幕 https://www.kzzimu.com ，目标是海外市场，先在国内试试水，de 下 bug 。
下面我跟大家分享技术、经验和资源哈。
一句话介绍
是基于 Whisper 魔改版，实现音视频转字幕，GPT-4 翻译加润色，识别说话人，字幕智能重排的一站式音视频平台。

V 友们肯定会说，XX 、XXX 和 XXXX 不都有这些东西？

我们的优势是：
[ol]

无须显卡，云端速度非常快。

普通用户可以免费使用。

傻瓜式，用户不需要有任何技术，不需要去搞什么 Key 。

解决很多 AI 模型的输出不稳定问题，保证结果的稳定性。

有一个体验非常好的字幕编辑器和文件管理系统。
[/ol]
对我们的产品的技术实现感兴趣的话，可以留言，我会分享一些技术细节。比如，我们的说话人识别，用的是 NVIDIA 的 Nemo 。
API
另外，V 友如果想要在自己的产品上快速实现我们现在的功能，我们也做了 API 可以对接，比如我们支持 2 小时以内，100M 的不分段的音频识别。
一些 todo
[ol]

提取音频的纯人声、纯背景（已经做好，测试上线）

海外版（架构一开始就是面向全球，现在正在准备外文资料和服务器架构）

下载合并了字幕的视频文件。（已经设计好）

根据字幕的剪辑功能。（新建文件夹）
[/ol]

做了一个结合多种 AI 模型的一站式字幕平台，同时也提供 API

浏览过的版块

热门主题

视频号去哪接商单？

灵感一到，突然我想搞一个论坛，大家给个建

你们卖过的最贵的一个网站是多少钱卖的

很多人说做网站不赚钱为了情怀，但对我来说

凡人 177 集修改版如何评价？

和大家分享我 vibe 的开源项目——muselab

又主动放弃一个米

其实没事隔三差五写写博客也蛮好，文笔有明

私域是个啥鸟玩意，我看是个人都能谈私域

刚用了下微信搜索里面的AI（全球最垃圾的AI

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则