python如何判断一个pdf文件中的内容是否是乱码(加密后导致的乱码)

查看 12|回复 1
作者:derick   
如题:加密的pdf文件和没加密的pdf文件混在了一起,现在需要区分两种文件
当前思路:目前想通过读取pdf文件内容,根据内容来区分
语言限制:python

文件, 乱码

Osk   

读取文件头是否有PDF关键字就可以了
rb打开文件,f.read()[:10],看看b"PDF"存不存在
您需要登录后才可以回帖 登录 | 立即注册

返回顶部