我感觉以现在的技术在 mac m 芯片上做一个实时转录再结合 LLM 做会议总结完全可行。我之前用过 mac 自带的 speech recognition api ,效果非常好,比 whisper 快且准确,可以结合 VAD ( https://github.com/snakers4/silero-vad ),说话人识别( optional ),做成 AI 会议记录 app 。
不止用在在线会议,线下会议也可以。我感觉大有可为呀,上面两个 APP 我试用的都卖 20-30 刀一年,好评也很多。问问大家目前市面上有类似的 app 吗,没有的话我要自己业余写一个,核心可以开源,只提供 cli 界面,再做一个完整 app 出来卖。