使用 whisper 制作音频转文字网站

查看 163|回复 14
作者:eightdoor   
目前实现
  • 使用 openai/whisper python+fastapi 实现音频、视频文件上传,后台通过 whisper 转换文字内容 存储数据库,通过定时任务,后台自动转换,目前只支持单个转换 不能并行转换

    计划
  • nuxt 制作网站页面,提供免费的转换。
  • 参考https://freesubtitles.ai/模式实现

    其他
  • 目前服务器是通过 frp 内网直接代理出去的,配置 e5+amd580 (搭配 rocm ),运行的模型大小是 medium 。如果有盈利点,可以买点好的配置服务器
  • 目前只想到这样做,可以后续提供 api 接口直接调用,提供付费服务。
  • 不知道想法是否可行,能不能产生盈利点,大家有什么好想法或者建议吗

    whisper, 转换, 盈利点, 后台

  • jayzau1973   
    你可以搜搜之前有个老哥做的 AI 字幕机,实现了盈利。
    不过他是打包成软件,用客户端资源进行计算,你这用自己的服务器成本会不会太高?
    z7356995   
    我是用 google colab 免费 gpu 计算,速度快
    UKnowMe   
    1. “目前只支持单个转换 不能并行转换” 这个指的是用户 A 每次只能转换 1 个,还是说用户 A 、用户 B 、用户 C 加起来只能转换 1 个,若 A 转换中,则 B 、C 阻塞?
    2. 你有什么比得过 https://freesubtitles.ai/ 的?无恶意,单纯觉得人家已经有了你所说的 “后续提供 api 接口直接调用,提供付费服务” ,那么是否意味着你比人家的功能还少?莫非你打算通过推广来赢得市场还是啥?
    3. 免费用户一直用脚本调用你的功能,你咋办?因为我正好有音频转文字的需求,未登录的用户,你该如何防止?还是说需要登录才能使用功能,通过登录用户来进行精准限制。
    molezznet   
    580 传家宝啊
    z7356995   
    其实赢利点不是音频转换,而是英语有声书网站,有很多有名的英语有声书,要嘛找得到 mp3, 要嘛找不到对应的逐句复读的材料,国外有一个 pt 有声书网站,可以下载各种有声书,然后提取转换 srt 字幕,就可以供英语学习者边看有趣的内容边听了,下什么内容转换可以按搜索量,或有偿加速,版权问题,,你看看每日英语听力,有几个音频字幕买了版权?
    z7356995   
    国外 pt 网站可以下载 mp3
    z7356995   
    一次转换可以多次贩卖
    eightdoor
    OP
      
    @jayzau1973 我找找看看,服务器成本很高,要是转换的话
    qW7bo2FbzbC0   
    如果 使用者传入涉政暴恐的录音,并且进行关联传播,你有做关键词屏蔽和错杀恢复逻辑吗?
    您需要登录后才可以回帖 登录 | 立即注册

    返回顶部