开发这个 App 的出发点是这样的。最近在看一本关于 PyTorch 的英文电子书,虽然也能看懂英文,但是效率肯定没有读母语来得高。同时书中的有些内容还不够理解,需要进一步提问澄清。所以我想把翻译和提问合在一起完成。简单找了下市面上的相关工具,发现没有特别称手的。有些 PDF 阅读器虽然能够翻译,但是要么收费,要么无法追问。另外就是这些阅读器的模型和提示词都是固定的,没法自定义(比如我想让用语接近中文习惯,减少机翻感)。
所以就有了自己开发的想法(这也是 AI 时代的好处吧,只要有想法和 token ,就可以自己实现)
使用上,你可以正常的输入文本让它翻译,但更好的方式直接把书中的某一页或多页直接截图贴给它。它会自动把图片拼接,同时识别文中的文字,代码,表格甚至插图,然后把翻译后的文字与这些内容重新组合在一起,形成一个排版好的 markdown 的文档,然后渲染出来。
另外上面说了,App 的定位是辅助阅读,除了翻译以外,你还可以就翻译中的内容直接提问。比如一开始我是用它来学习 PyTorch ,对于书中不理解的地方就直接问它。如果你在别的地方提问,需要把上下文搬过去,但这里由于本来就有上下文,所以 AI 会更好的理解你的问题。



后来我发现这个 App 对另外我之前看过的一本书——《 The Photographer's Eye 》(摄影师之眼)也很有用。这本书的排版上不太寻常,它的一页很宽,在显示器上看着很累。使用这个 App 翻译+重排以后,可看度提升了很多。当然,提问也是很重要的,原书文字有些晦涩,翻译+提问后理解更加准确了。


如果大家也觉得有用,我就把它再做进一步的 polish ,发布出来。
或者大家还有什么建议都可以说说。

