import pandas as pd
from docx import Document
# 读取Word文档
doc = Document('output.docx')
# 初始化列表来存储数据
data = []
# 遍历Word文档中的段落
temp_data = []
for para in doc.paragraphs:
# 使用正则表达式匹配所需数据
year_month_match = re.search(r'\d{4}年\d{1,2}月', para.text)
if year_month_match:
year_month = year_month_match.group()
temp_data.append(year_month)
numbers = re.findall(r'\d+\.?\d*', para.text)
temp_data += numbers
if len(temp_data) == 13:
data.append(temp_data)
temp_data = []
# 使用pandas将数据转换为DataFrame
columns = ['年份', '次均门诊费用_三级', '当年价格涨跌幅_三级_门诊', '可比价格涨跌幅_三级_门诊', '次均门诊费用_二级', '当年价格涨跌幅_二级_门诊', '可比价格涨跌幅_二级_门诊', '次均住院费用_三级', '当年价格涨跌幅_三级_住院', '可比价格涨跌幅_三级_住院', '次均住院费用_二级', '当年价格涨跌幅_二级_住院', '可比价格涨跌幅_二级_住院']
df = pd.DataFrame(data, columns=columns)
# 将数据保存到Excel文件中
df.to_excel('output_data.xlsx', index=False)
这是gpt写的代码
https://wwwc.lanzoub.com/ilEs30uhou1i
这是我的word案例和想要输入到的excel表格模板
我运行gpt的代码只会给我生成一个excel表格 但是并不会储存word的内容到excel中