pdf 裁剪后识别 content 问题,出现裁剪前内容

查看 25|回复 0
作者:Qetesh   
使用 python pypdf2 库裁剪 PDF 页面,裁剪识别页面内容。
通过 tika 或者 pdfminer 都能识别出裁剪前的文本内容,导致识别结果有问题。
有没有大佬遇到过这个情况,怎么解决的。
您需要登录后才可以回帖 登录 | 立即注册

返回顶部