@wyd011011daniel 感谢佬反馈,我最近测试了一个本地中文模型,但可惜太耗电了,不敢上,再等等吧,有优化好了的版本就会上,另外你说的接入自己的 API ,我考虑过,但这个实现有点麻烦,因为要兼容不同的模型,而且真正的情感朗读其实是要带情感标签的,这个需要快速的模型 api 支持才行,我后面再看看吧
@DearFox 感谢佬的反馈,这个问题还存在吗?我确实已经优化了缓冲,如果还存在这个问题,那应该不是缓冲的问题了,如果方便的话请通过 APP 设置页面的邮件把相关的书籍发给我测试一下看看具体是什么问题吧
@jobives2023 #34 我对 API 兼容性还是挺期待的。如果开发者适配不同模型是有一些难度的话,建议可以引入类似“爱阅记”的自定义模式,允许用户自主配置 HTTP 请求。 对于具备一定技术基础(如了解 API 概念、熟悉云服务账户注册)的用户而言,在 AI 的辅助指导下,完成这类配置并非难事。如果平台能够提供可视化的自定义配置界面,或者支持导入他人分享的预设配置文件(简单的 json 文本),普通用户便只需填入自己的密钥( API Key )即可直接使用,这将大幅降低操作门槛。也就是说,每一个 AI 服务或者说语音 TTS 服务只需要某一个人完成适配,然后上传到例如 GitHub 的仓库里,就可以让所有用户一起使用,只需要填入自己的 API key 。此外,鉴于目前诸如小米等厂商已开放了自身的 TTS (语音合成)云服务,我觉得应该是有一定前景的。实际上阅读,爱阅记等软件就是这么做的。 然后你说的情感朗读,我知道真正的情感朗读是要带情感标签的,但是我自己是把语音情感当做一个全局化的设置作为特定音色进行听书。嗯,或者软件里的 TTS 使用的是 Azure 的 TTS 的话,也可以把那些情感类型和情感强度的选项加上。不过,Azure 的 TTS API 还是挺贵的,所以我期望是能够让用户用自己的。这样可以减轻开发者的负担
@wyd011011daniel #37 嗯,这是爱阅记的听书配置文件的 JSON 文件直接复制。甚至我觉得可以直接按照类似爱阅记或者阅读的模板直接进行导入因为无论是字节或者百度之类的 TTS ,这样的模板已经有较大的应用,我看到很多用户就是按照这样的模板直接填入自己的 API 进行听书,很多用户也会分享和使用,如果能够参考这样的配置文件就可以把这方面的用户进行一个吸引{ "loginUrl": "", "maxWordCount": "", "ratePercent": 0.5, "ttsConfigGroup": "Azure", "_ClassName": "JxdAdvCustomTTS", "_TTSConfigID": "对应的 id", "httpConfigs": { "useCookies": 1, "headers": { } }, "ttsHandles": [ { "paramsEx": "", "nextPageForGetMedthod": 1, "processType": 1, "maxPageCount": 1, "method": 0, "requestByWebView": 0, "nextPageParams": { }, "parser": { "playData": "ResponseData" }, "url": "https://eastasia.tts.speech.microsoft.com/cognitiveservices/v1", "params": { "text": "%@" }, "httpConfigs": { "useCookies": 1, "customFormatParams": "params[text]", "headers": { "User-Agent": "AiyueTTS", "Content-Type": "application/ssml+xml", "X-Microsoft-OutputFormat": "audio-24khz-48kbitrate-mono-mp3", "ocp-apim-subscription-key": "对应的 key" } } } ], "_TTSName": "Azure 晓晓 gentle" }
@wyd011011daniel #38 因为我觉得阅读作为安卓的比较领先的阅读软件,iOS 上并没有能够与它太好进行竞争的软件。如果能做这样的适配,我觉得能在一定程度上吸引从安卓转 iOS 的阅读用户。同时,我觉得这样子可以借助社区社群的力量完成大部分 TTS 服务的适配,也是一件好事