Yoo趣儿 › Geek › 程序员 › pdf 裁剪后识别 content 问题，出现裁剪前内容 ...

pdf 裁剪后识别 content 问题，出现裁剪前内容

查看 112|回复 0

作者：Qetesh 发布时间：2023-2-6 13:26:55

使用 python pypdf2 库裁剪 PDF 页面，裁剪识别页面内容。
通过 tika 或者 pdfminer 都能识别出裁剪前的文本内容，导致识别结果有问题。
有没有大佬遇到过这个情况，怎么解决的。

AD1

热门主题

热门板块

问与答分享发现分享创造奇思妙想分享邀请码商业推广优惠信息 Python PHP Java JavaScript Node.js Go语言 C++HTML

公告

返回顶部