pdf逐页转换成png

查看 68|回复 8
作者:naonao211   
前两天看到有人发pdf转图片的软件,正好自己也在学python,就用Python写了一个,它可以自动检测当前py文件目录下的pdf文件,然后逐页转换成png格式,并存储到目录下的“转换后的文件夹”,文件名以001,002,003...命名。
效果图:


image.png (1.35 MB, 下载次数: 0)
下载附件
2024-10-27 15:31 上传

注意:pdf2image库需要安装Poppler,安装后需要重启代码编辑器
代码:[Python] 纯文本查看 复制代码import os
from PyPDF2 import PdfReader
from pdf2image import convert_from_path
def convert_pdf_to_images(pdf_path, output_folder):
    # 创建输出文件夹如果不存在
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)
    # 打开PDF文件
    with open(pdf_path, 'rb') as file:
        reader = PdfReader(file)
        num_pages = len(reader.pages)
        # 遍历每一页
        for page_number in range(num_pages):
            # 将PDF页面转换为图像
            images = convert_from_path(pdf_path, first_page=page_number + 1, last_page=page_number + 1)
            image = images[0]
            # 保存图像
            image_filename = f"{output_folder}/{page_number + 1:03d}.png"
            image.save(image_filename, "PNG")
            print(f"Saved {image_filename}")
# 获取当前目录下所有PDF文件
pdf_files = [f for f in os.listdir('.') if f.endswith('.pdf')]
# 转换每个PDF文件
for pdf_file in pdf_files:
    convert_pdf_to_images(pdf_file, '转换后')
目录和名字之类的大家可以修改成自己需要的。

文件, 转换成

Altman1997   

学学python再看
o276496959   

感谢分享
langyoChina   

之前都是跑去 smartpdf 在线转换的,本地装的 pandoc 不好操作
这个就有点意思了,直接开个终端手动进 python 转换,这样就不用担心 pdf 泄露了
alidadai   

正好需要,试试
qqycra   

很多功能quicker都有,我现在小功能都不写代码了
axinabcd   

能不能搞个高质量的转换为word的
axinabcd   

能不能搞个高质量的转换为word的
banxia1986   

感谢楼主,谢谢提供资源。
您需要登录后才可以回帖 登录 | 立即注册

返回顶部