千问推出了 PC 语音输入,功能和 typeless 差不多

查看 156|回复 26
作者:MuyuQ   
巨头随手做的东西,就把一个创新赛道里的参赛者挤死大半。
比功能,巨头随便投入点人力就能碾压。
比营销,根本不是一个量级。
比财力,比模型,这都没法比啊。。
说的就是上半年国内蛮火的闪电说。
更何况后面还有豆包的语音输入法蓄势待发。

语音, 巨头, 竞争

MuyuQ
OP
  
有一篇爱范儿的广告可以大概了解下。
https://www.ifanr.com/1664830
Moonkin   
这是啥新鲜玩意吗?把人说的话 stt ,文本送个本地小模型润色,不就行了。。。我有什么漏了的地方吗?
ktyang   
也不搞个 linux 的
ChrisV5   
有的,core 没啥技术含量,各家都有 tts 和 llm 。但是输入法的集成开发有很多很多细节。虽然 vibe coding 很快,但是都架不住生产级别的 bug 。有一定的工程量。
hxzhouh1   
闪电说挺好用的,支持本地模型,自定义 api ,简单、纯粹。
ko20   
诶,就没有哪家做一个 linux 这方面好用的客户端吗?目前 debian13+gnome48 用下来没一个满意的
capric   
原理是 asr(语音识别),llm 语义重组排版等
有意思的是前向修正,比如你说“不对,不对”,它要理解你是否定前面说的
另外评价标准也很意思,不是错字率而是意图达成率(是否需要手动编辑)
typeless 开源替代
https://github.com/cjpais/handy
https://github.com/sypsyp97/light-whisper
https://github.com/tover0314-w/opentypeless
MuyuQ
OP
  
@ChrisV5 是的。但开源的几个项目用起来都各有各的难受。目前最强还是 type less ,但是那玩意儿付费太贵了点。
@capric 几个开源项目我也看过,维护是个问题,修 bug 不积极。而且差距还是挺明显的。
@hxzhouh1 闪电说模型肯定没法和大厂比,自定义功能还是挺好用的。闪电说的优势是搭配豆包流式语音识别,但是等豆包也推出语音输入法的时候闪电说就没什么优势了。  闪电说的付费是 AI 助手,但这个方向肯定打不过千问和豆包。
ChrisV5   
@MuyuQ #8 因为我自己也手搓了一个,拿 rime + 豆包 asr + deepseek llm 。
有些小问题,我自己能忍。但是发出去的话,bug 一堆。
您需要登录后才可以回帖 登录 | 立即注册

返回顶部