求倾斜汉字 ocr 识别方案

查看 166|回复 3

作者：jason56 发布时间：2024-8-27 11:03:53

单个汉字左或右倾斜无法识别或错误识别，列出用过的方案：
1. 阿里云腾讯云百度云 API 接口方式 OCR
2. Tesseract-OCR 原生或自训练数据集
3. 百度 paddlepaddle PP-OCRv4
4. python dataset 自训练数据集
--
以上方案汉字右倾斜识别成功率较高，左倾斜识别较差。
自训练数据集：通过将单一汉字图片旋转不同角度打标签方式训练，本身汉字图片较小，也许是这个原因无法训练出正确的数据集。
--
目前方案：
灰度二值化后将图片顺逆向分别+－ 2 度旋转 20 次，得到生成后的 40 张图片，手搓 Hough 直线检测算法，筛选出投票得分最多的图片，最后通过 paddlepaddle PP-OCRv4 进行识别，成功率 70%，4h8g 耗时 4-6 秒。
--
求助大神：
目前是否有专门针对倾斜汉字 OCR 的场景模型，通过打标签训练数据集的也行。

zsj1029 2024-8-27 11:04:52

手动的话
先用夸克扫描王处理成平面去杂
然后再用 ocr ，识别率就非常高了

rming 2024-8-27 11:05:28

直接用公开数据集在训练中做数据增强，在 ppocrv4 基础上做迁移学习就行，自己标注意义不大，除非是字典里没有的汉字
公开数据集的话首先就规避掉了自己搞数据集的数据本身的问题
我隐约记得 ppocr 是有行高限制的，太小的图在训练时前会过滤掉，也可以用超分算法模型预处理那些小图片（但是感觉这个路子不太值得）
训练时候的预处理和预测的预处理要保持一致，也不太随便加，有时候不加反而效果更好

jason56

2024-8-27 11:06:13

@zsj1029 谢谢，我们自动化场景，用不了手动方案。

求倾斜汉字 ocr 识别方案

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

求倾斜汉字 ocr 识别方案

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告