为何开源环境的 OCR 没有进步呢?

查看 186|回复 12
Arctic24
OP
  
我是原以为 PaddleOCR 这种 31K 星,贡献者超多,issues 近万的超级项目会有比肩大厂的效果。。。。
我自己部署,别人的部署,各种参数,我都试过。和差的比确实不错,但和 5 年前的 google 的拍照翻译比,差很多。
zhangxiuyan   
关键是训练数据的问题吧,优秀的模型你没有数据喂,和一般的模型但有 google 这种体量的公司喂数据,关于速度问题,估计是有做过专门的优化的,paddle 毕竟是在开源平台基础上
C0dEr   
问下大家有什么好用的 pdf 表格识别的工具?
您需要登录后才可以回帖 登录 | 立即注册

返回顶部