基于 whisper 的实时语音识别 网页和桌面客户端

查看 23|回复 0
作者:relsoul   
前言
最近上了个网课,由于是直播课,没有字幕,感觉不太爽,调研了一下 目前没有基于本地 whisper 的实时字幕软件.. 于是自己手搓了一个~ 欢迎 star
传送门: https://github.com/Relsoul/whisper-win-gui
支持功能
  • 实时语音识别
  • 实时语音识别结果展示
  • 实时语音识别结果 websocket 推送
  • 系统音频监听(windows)
  • 网页 video websocket 推送及字幕功能

    研究网页捕捉 audio 流花了一点点时间~ audiocontext 获取的有点点问题~ 改捕捉 video 流 filter audio 了~
    对 gui 开发不太熟~ 本来想用 webview 的,但是又没透明效果 还好有 flet~
    更多简介 github 已经列出来了~ 这里就不再重复列出了,希望能帮到有需要的人
  • 您需要登录后才可以回帖 登录 | 立即注册

    返回顶部