目前有什么开源的语音转文字准确率高的？ ...

作者：yhm2046 发布时间：2023-9-1 00:01:15

目前用 whisper+ggerganov 模型，2.8G 的，显卡是 gtx970 ，转译出来的全部是这种效果：
[00:29:20.000 --> 00:29:26.000] ( 錄影時間 )
[00:29:26.000 --> 00:29:32.000] ( 錄影時間 )
[00:29:32.000 --> 00:29:38.000] ( 錄影時間 )
[00:29:38.000 --> 00:29:44.000] ( 錄影時間 )
[00:29:44.000 --> 00:29:49.000] ( 錄影時間 )
[00:29:49.000 --> 00:29:55.000] ( 錄影時間 )
[00:29:55.000 --> 00:30:01.000] ( 錄影時間 )
[00:30:01.000 --> 00:30:07.000] ( 錄影時間 )
[00:30:07.000 --> 00:30:13.000] ( 錄影時間 )
[00:30:13.000 --> 00:30:18.000] ( 錄影時間 )
[00:30:18.000 --> 00:30:24.000] ( 錄影時間 )
[00:30:24.000 --> 00:30:30.000] ( 錄影時間 )
[00:30:30.000 --> 00:30:36.000] ( 錄影時間 )
[00:30:36.000 --> 00:30:42.000] ( 錄影時間 )
[00:30:42.000 --> 00:30:47.000] ( 錄影時間 )
[00:30:47.000 --> 00:30:53.000] ( 錄影時間 )
[00:30:53.000 --> 00:30:59.000] ( 錄影時間 )
[00:30:59.000 --> 00:31:05.000] ( 錄影時間 )
[00:31:05.000 --> 00:31:11.000] ( 錄影時間 )
[00:31:11.000 --> 00:31:16.000] ( 錄影時間 )
[00:31:16.000 --> 00:31:22.000] ( 錄影時間 )
之前还能有一半左右的可以译成有效文字，不知道是否这次的录音音源不行，我是用手机录音的

錄影, 時間

mushuanl 2023-9-1 00:02:15

拿最大的那个模型，不要量化，我前面直接 cpu 转的效果不错

1311317 2023-9-1 00:02:52

wenet

目前有什么开源的语音转文字准确率高的？

浏览过的版块

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则