做了一个专门翻译漫画图片文字的小工具，分享下实现思路 ...

最近在看一些日文漫画和海外 webtoon 的时候，发现一个比较麻烦的问题：
图片里的文字很难直接翻译。
普通翻译工具基本都是针对纯文本的，但漫画、截图、气泡对话这些内容：
文字不可复制
字体复杂
竖排/混排较多
还有多语言混在一起
后来自己做了一个小工具，主要是把「 OCR + 翻译」流程简化到一步完成，适配漫画和图片场景。
大致流程其实不复杂：
图像文字检测（气泡/区域）
OCR 提取文本
自动语言识别
再走翻译模型处理短句对话
实际测试下来，发现一个有意思的点：
在这种场景下，OCR 准确率反而比翻译模型更关键，因为漫画字体和排版干扰很大。
目前这个工具主要用来：
看外语漫画/生肉
翻译截图里的文字
一些图片型内容快速理解
做成了一个简单的在线版本，省去本地部署和复杂配置：
https://aimangatranslate.com
不是做通用翻译的，更偏图片文本场景，所以适用面会比较垂直。
如果有做过 OCR 或多语言处理的 v 友，也挺好奇你们在复杂排版场景下是怎么提升识别稳定性的。

做了一个专门翻译漫画图片文字的小工具，分享下实现思路

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则