批量提取PPT文字到word文档

查看 87|回复 5
作者:Eks6666   
[Python] 纯文本查看 复制代码#提取所有文本字符
from pptx import Presentation
data = []
prs = Presentation('data\制造业必修课.pptx')
for slide in prs.slides: #遍历每页PPT
    for shape in slide.shapes: #遍历PPT中的每个形状
        if shape.has_text_frame: #判断该是否包含文本,保证有文本才提取
            for paragraph in shape.text_frame.paragraphs: #按文本框中的段落提取
                data.append(paragraph.text) #提取一个段落的文本,就存到列表data中
#写入文本文件
TxtFile = open('data\制造业必修课.txt', 'w',encoding='utf-8')
for i in data:
    TxtFile.write(i+'\n') #写入并换行,以保证正确分段
TxtFile.close() #保存
#写入word文件
import docx
doc=docx.Document()#创建一个word文件对象
for i in data:
    doc.add_paragraph(i) #增加一个段落,并将列表中的一个字符串写入word文件
doc.save('data\制造业必修课.docx')#保存

文本, 必修课

hrh123   

这代码挺实用的
但是希望能遵守PEP8文档吧
chen360781   

有用吗,谁试了
liziming   

这个技巧好啊
Eks6666
OP
  


chen360781 发表于 2023-9-27 23:48
有用吗,谁试了

你可以试一下啊,老铁
grrr_zhao   

我一看代码就发怵。不会用感觉。。。
您需要登录后才可以回帖 登录 | 立即注册

返回顶部