pdf 复制出来是乱码 怎么解决

查看 80|回复 6
作者:amiwrong123   
pdf 是 mindshare 的书籍(出版时间大概 2000 年),看起来每个单词都是可以复制的,但是复制出来却是乱码。
用了好几种编辑器打开,复制都是乱码:wps 、SumatraPDF 、adobe reader 、zerote 。
网上看的方法: https://www.bilibili.com/read/cv23470141/
查看了字体类型,去网站里搜,也搜不到。
PS:之前用 python 想读取这个 pdf 里面的内容,发现是程序读取出来都是乱码的。结果发现复制 都是乱码的。。

复制, PDF, 读取,

yinmin   
OCR
kokutou   
内嵌字体,字体和文字不是对应的,参考起点之类的在线加密。。。
yinmin   
运行 QQ 电脑版,然后用快捷键 ctrl-alt-A ,选中屏幕区域点击“屏幕识图”按钮,等几秒就能 copy 文字了,识别率还是比较好的。
Puteulanus   
不好识别的话淘宝还有代手打的
Ericcccccccc   
截图到微信里然后用自带的 ocr 吧
n1cogrv   
@kokutou #2 @amiwrong123
要真是这样的话,OP 直接考虑 OCR 吧,不要考虑从数字层面读取了。
可以看看 https://github.com/hiroi-sora/Umi-OCR
您需要登录后才可以回帖 登录 | 立即注册

返回顶部