[免费] [Windows 版来了] LazyTyper:语音 7x 倍速怒喷 AI

查看 1013|回复 100
Parva   
@codehz 试一下界面里面重播一下你的声音,看能不能听见。我估计是没有录到
基于 Whisper 3 的模型的确有这个问题,如果没有录到声音,它就会出现这些不着调的文字。
@xljya 了解咯,了解咯。我记一下。
@cyp0633 倒也不会。不过你会发现很多你平时说话和打字之间的表达上的差异,也是挺有意思的。
还有就是状态不太好的时候更容易发现,因为表达就会有很多吞吞吐吐的地方,更容易发现自己需要休息休息。
oldcai
OP
  
赞!走向未来!
目前体验问题( windows11 ,版本 1.1.15 ):
1. 词汇表 not work:可能也跟 具体 API 有关?(我用的是火山引擎)加了`Claude`,仍然识别成`Cloud`
2. 启动延迟:我已经保持麦克风激活了,但隔几分钟没有用的话,按下快捷键需要等个好几秒才开始录制
3. 设置界面窗口,windows11 任务栏上没有一个对应的窗口栏,我需要将其它窗口都最小化才能看到它
4. “开机启动”那里文案还是 MacOS
5. 提示有新版本,点击“安装更新”没有反应
另外我也想要鼠标快捷键。
HRTops   
@Parva 1. 火山引擎极速版的确在 API 层面没有支持自定义词表;这两天我做一下实验,看看其他的版本有没有办法支持自定义词汇列表
2. 是每次都这样吗?还是偶发性的?具体能不能描述一下?
3. 目前是在右下角有托盘图标里面点设置按钮,会显示设置窗口
4. 更新一下 APP , 应该已经修改好了
5. 是的,这几天在搞这个新版本,现在已经好了,可以更新了
@wang777 已经修复了,更新一下看看吧~
HRTops   
我现在给你回复用的就是你这个语音输入法但现在有一个问题就是语音识别完之后这个过程当中他是没有标点符号的这就有一个问题是我再说一段然后自己,。这个很麻烦
oldcai
OP
  
这个女人输入法的标点符号问题是不是可以用语音模型来解决有没有完整的解决方案有谁遇到过这个问题吗怎么解决的
YGSC   
@HRTops Whisper 的确有这个问题,优化只能减轻不能避免。可以试试豆包和 ElevenLabs
oldcai
OP
  
感觉可以提高一下麦克风的灵敏度或者说增益,可以增加个相关的设置参数,我的麦克风离得比较远,在当前最新版中会被识别为静音,在豆包里倒是可以正常语音识别的
另外对于大写锁定键可否优化一下,感觉按住大写锁定来触发识别是很顺手的,现在的版本里使用大写锁定似乎会一直大写锁定,无法在松手后取消锁定
HRTops   
@YGSC 的确有相关“优化”,那我改改😂
sphendae   
@oldcai 我现在用的就是豆包,你是文档中推荐的设置
sphendae   
@codehz 笑死。。。gpt 的语言转录也常出现就是了
您需要登录后才可以回帖 登录 | 立即注册

返回顶部