开发了这样一个翻译 app,大家会用吗?

查看 46|回复 4
作者:wbh   
最近借助 AI 实现了这样一个翻译 App (名字还没想好)。
开发这个 App 的出发点是这样的。最近在看一本关于 PyTorch 的英文电子书,虽然也能看懂英文,但是效率肯定没有读母语来得高。同时书中的有些内容还不够理解,需要进一步提问澄清。所以我想把翻译和提问合在一起完成。简单找了下市面上的相关工具,发现没有特别称手的。有些 PDF 阅读器虽然能够翻译,但是要么收费,要么无法追问。另外就是这些阅读器的模型和提示词都是固定的,没法自定义(比如我想让用语接近中文习惯,减少机翻感)。
所以就有了自己开发的想法(这也是 AI 时代的好处吧,只要有想法和 token ,就可以自己实现)
使用上,你可以正常的输入文本让它翻译,但更好的方式直接把书中的某一页或多页直接截图贴给它。它会自动把图片拼接,同时识别文中的文字,代码,表格甚至插图,然后把翻译后的文字与这些内容重新组合在一起,形成一个排版好的 markdown 的文档,然后渲染出来。
另外上面说了,App 的定位是辅助阅读,除了翻译以外,你还可以就翻译中的内容直接提问。比如一开始我是用它来学习 PyTorch ,对于书中不理解的地方就直接问它。如果你在别的地方提问,需要把上下文搬过去,但这里由于本来就有上下文,所以 AI 会更好的理解你的问题。





后来我发现这个 App 对另外我之前看过的一本书——《 The Photographer's Eye 》(摄影师之眼)也很有用。这本书的排版上不太寻常,它的一页很宽,在显示器上看着很累。使用这个 App 翻译+重排以后,可看度提升了很多。当然,提问也是很重要的,原书文字有些晦涩,翻译+提问后理解更加准确了。




如果大家也觉得有用,我就把它再做进一步的 polish ,发布出来。
或者大家还有什么建议都可以说说。

翻译, 阅读, AI

niboy   
我应该是用不着
1. 如果是 pdf 或网页,直接用沉浸式翻译就行了,不用自己截图发送啊
2. 如果说要理解内容,文档扔给 IMA ,在 IMA 直接问,或者 cursor 之类的截图问就行
wbh
OP
  
@niboy 是的,通过工具组合肯定也是能实现目的的。
不过我这里是想实现一站式的效果,我想了想,本质上我对它的定位应该是属于阅读辅助,不完全是简单的翻译。我的想法是,一本书你看到哪里,就截几张图丢进去,让它翻译和排版,方便你阅读和理解。然后有问题就提问,之于翻译结果你保不保留,都随你自己。最重要的是你吸收和理解了你所阅读的内容。
SuperDaniel313   
最近在用 NotebookLM 读一些大部头,有些没译本,摸索出来的方法就要么丢给豆包/IMA 来汉化,同时一份副本塞到 NLM 里,然后边读边问。或者把原文处理成 HTML ,直接用浏览器插件翻译,选择 LLM 的自由度更高。同样也是配合 NLM 来学习。
综合下来看,LLM 除了编码相关的实践,目前对我来说用处更大的是辅导学习。毫不夸张地说,NLM 堪比 7x24 小时的全领域专家实时解答。
NLM 背靠 Gemini 多模态,图表、公式、图片,全都能语义化理解,在这个领域还没看到其他能打的出来。
SayHelloHi   
如果是翻译 PDF 的话 可以看看 UPDF 这个软件
非常棒
您需要登录后才可以回帖 登录 | 立即注册

返回顶部