求倾斜汉字 ocr 识别方案

查看 153|回复 3

作者：jason56 发布时间：2024-8-27 11:03:53

单个汉字左或右倾斜无法识别或错误识别，列出用过的方案：
1. 阿里云腾讯云百度云 API 接口方式 OCR
2. Tesseract-OCR 原生或自训练数据集
3. 百度 paddlepaddle PP-OCRv4
4. python dataset 自训练数据集
--
以上方案汉字右倾斜识别成功率较高，左倾斜识别较差。
自训练数据集：通过将单一汉字图片旋转不同角度打标签方式训练，本身汉字图片较小，也许是这个原因无法训练出正确的数据集。
--
目前方案：
灰度二值化后将图片顺逆向分别+－ 2 度旋转 20 次，得到生成后的 40 张图片，手搓 Hough 直线检测算法，筛选出投票得分最多的图片，最后通过 paddlepaddle PP-OCRv4 进行识别，成功率 70%，4h8g 耗时 4-6 秒。
--
求助大神：
目前是否有专门针对倾斜汉字 OCR 的场景模型，通过打标签训练数据集的也行。

zsj1029 2024-8-27 11:04:52

手动的话
先用夸克扫描王处理成平面去杂
然后再用 ocr ，识别率就非常高了

rming 2024-8-27 11:05:28

直接用公开数据集在训练中做数据增强，在 ppocrv4 基础上做迁移学习就行，自己标注意义不大，除非是字典里没有的汉字
公开数据集的话首先就规避掉了自己搞数据集的数据本身的问题
我隐约记得 ppocr 是有行高限制的，太小的图在训练时前会过滤掉，也可以用超分算法模型预处理那些小图片（但是感觉这个路子不太值得）
训练时候的预处理和预测的预处理要保持一致，也不太随便加，有时候不加反而效果更好

jason56

2024-8-27 11:06:13

@zsj1029 谢谢，我们自动化场景，用不了手动方案。

求倾斜汉字 ocr 识别方案

浏览过的版块

热门主题

人们的生活已经离不开网络，却可以完全不需

PHP开发找不到工作尝试去做独立站运营（电

我发现我在这里还是更新网站比较勤的！

购买友情链接都不能在线充值了那么严格

看看，这些网站都被污染了

【每日一问】有谁知道哪里买诊所处方方面的

个人博客网站是否要拒绝境外访问？

把谷歌的蜘蛛也禁了没ip 还天天爬

豆包收费你还用吗？

你们的站有没有被美国各种AI爬虫爬得流量用

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

求倾斜汉字 ocr 识别方案

浏览过的版块

热门主题

人们的生活已经离不开网络，却可以完全不需

PHP开发找不到工作尝试去做独立站运营（电

我发现我在这里还是更新网站比较勤的！

购买友情链接 都不能在线充值了 那么严格

看看，这些网站都被污染了

【每日一问】有谁知道哪里买诊所处方方面的

个人博客网站是否要拒绝境外访问？

把谷歌的蜘蛛也禁了 没ip 还天天爬

豆包收费你还用吗？

你们的站有没有被美国各种AI爬虫爬得流量用

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

购买友情链接都不能在线充值了那么严格

把谷歌的蜘蛛也禁了没ip 还天天爬

在 Yoo趣儿投放广告