Pyhton怎么处理word文档内容到excel表格中呀

查看 130|回复 7
作者:980041382   
[Python] 纯文本查看 复制代码import re
import pandas as pd
from docx import Document
# 读取Word文档
doc = Document('output.docx')
# 初始化列表来存储数据
data = []
# 遍历Word文档中的段落
temp_data = []
for para in doc.paragraphs:
    # 使用正则表达式匹配所需数据
    year_month_match = re.search(r'\d{4}年\d{1,2}月', para.text)
    if year_month_match:
        year_month = year_month_match.group()
        temp_data.append(year_month)
    numbers = re.findall(r'\d+\.?\d*', para.text)
    temp_data += numbers
    if len(temp_data) == 13:
        data.append(temp_data)
        temp_data = []
# 使用pandas将数据转换为DataFrame
columns = ['年份', '次均门诊费用_三级', '当年价格涨跌幅_三级_门诊', '可比价格涨跌幅_三级_门诊', '次均门诊费用_二级', '当年价格涨跌幅_二级_门诊', '可比价格涨跌幅_二级_门诊', '次均住院费用_三级', '当年价格涨跌幅_三级_住院', '可比价格涨跌幅_三级_住院', '次均住院费用_二级', '当年价格涨跌幅_二级_住院', '可比价格涨跌幅_二级_住院']
df = pd.DataFrame(data, columns=columns)
# 将数据保存到Excel文件中
df.to_excel('output_data.xlsx', index=False)
这是gpt写的代码
https://wwwc.lanzoub.com/ilEs30uhou1i
这是我的word案例和想要输入到的excel表格模板
我运行gpt的代码只会给我生成一个excel表格 但是并不会储存word的内容到excel中

涨跌幅, 门诊

980041382
OP
  

@hoochanlon @52like @小小涩郎
yucevip   

自己写判断什么内容往表格第几列存
980041382
OP
  


yucevip 发表于 2023-5-2 19:41
自己写判断什么内容往表格第几列存

df = pd.DataFrame(data, columns=columns)  这个就是存入的逻辑啊
小小涩郎   

我只会VBA 的啊      Pyhton母鸡啊
980041382
OP
  


小小涩郎 发表于 2023-5-2 20:36
我只会VBA 的啊      Pyhton母鸡啊

那VBA怎么实现这个需求呀
小小涩郎   


980041382 发表于 2023-5-2 20:40
那VBA怎么实现这个需求呀

我看一下
小小涩郎   


小小涩郎 发表于 2023-5-2 20:46
我看一下

你这个WORD格式都是这么固定的格式吗   看起来  好像可以提取
您需要登录后才可以回帖 登录 | 立即注册

返回顶部