@codehz 试一下界面里面重播一下你的声音,看能不能听见。我估计是没有录到 基于 Whisper 3 的模型的确有这个问题,如果没有录到声音,它就会出现这些不着调的文字。 @xljya 了解咯,了解咯。我记一下。 @cyp0633 倒也不会。不过你会发现很多你平时说话和打字之间的表达上的差异,也是挺有意思的。 还有就是状态不太好的时候更容易发现,因为表达就会有很多吞吞吐吐的地方,更容易发现自己需要休息休息。
赞!走向未来! 目前体验问题( windows11 ,版本 1.1.15 ): 1. 词汇表 not work:可能也跟 具体 API 有关?(我用的是火山引擎)加了`Claude`,仍然识别成`Cloud` 2. 启动延迟:我已经保持麦克风激活了,但隔几分钟没有用的话,按下快捷键需要等个好几秒才开始录制 3. 设置界面窗口,windows11 任务栏上没有一个对应的窗口栏,我需要将其它窗口都最小化才能看到它 4. “开机启动”那里文案还是 MacOS 5. 提示有新版本,点击“安装更新”没有反应 另外我也想要鼠标快捷键。
@Parva 1. 火山引擎极速版的确在 API 层面没有支持自定义词表;这两天我做一下实验,看看其他的版本有没有办法支持自定义词汇列表 2. 是每次都这样吗?还是偶发性的?具体能不能描述一下? 3. 目前是在右下角有托盘图标里面点设置按钮,会显示设置窗口 4. 更新一下 APP , 应该已经修改好了 5. 是的,这几天在搞这个新版本,现在已经好了,可以更新了 @wang777 已经修复了,更新一下看看吧~
感觉可以提高一下麦克风的灵敏度或者说增益,可以增加个相关的设置参数,我的麦克风离得比较远,在当前最新版中会被识别为静音,在豆包里倒是可以正常语音识别的 另外对于大写锁定键可否优化一下,感觉按住大写锁定来触发识别是很顺手的,现在的版本里使用大写锁定似乎会一直大写锁定,无法在松手后取消锁定