目前语音转文字技术还是比较成熟的,OpenAI 也开源了 Whisper 模型。所以想着说能不能做个网站,用户只需要打开网页 -> 上传音频 -> 留下邮箱,就可以提交转换任务,转换结果会在任务完成后发到邮箱。
因为本来就打算在家弄一台多核 linux 服务器来做 NAS/开发机,所以应该可以匀出 10+个线程来做免费网站。文字转换质量目前来看主要依赖 Whipser 模型,但免费网站转换速度可能就比较尴尬了(应该会比 0.5 倍速更低)。
目前想到的商业化空间主要是打开网页 -> 上传音频 -> 留下邮箱 -> 扫码支付,定价为讯飞听见的一半左右( 5 元 /小时)应该会有盈利空间。主要解决痛点:无需注册(也可以注册来查看转换历史)、相对便宜。不过不清楚有没有这种匿名&便捷的支付途径。
大家觉得怎么样?从用户需求的角度来看,免费网站使用场景多吗?从商业化的来看,付费网站有没有市场空间?