[Python] 纯文本查看 复制代码import requests
from bs4 import BeautifulSoup
import pandas as pd
# 定义目标URL
url = 'http://m.tetegu.com/longhubang/?src=topnav&r=0.36531248951690687' # 替换为实际的龙虎榜数据页面
# 发送HTTP请求
response = requests.get(url)
response.encoding = 'utf-8'
# 解析网页内容
soup = BeautifulSoup(response.text, 'html.parser')
# 提取数据
data = []
table = soup.find('table') # 假设数据在表格中
if table:
for row in table.find_all('tr'):
cols = row.find_all('td')
cols = [ele.text.strip() for ele in cols
if cols: # 过滤掉空行
data.append(cols)
# 转换为DataFrame
if data:
df = pd.DataFrame(data)
# 打印列数
print(f"列数: {df.shape[1}")
# 根据实际情况调整列名
df.columns = [f'Column{i+1}' for i in range(df.shape[1])] # 动态生成列名
# 保存为excel.xlsx文件
df.to_excel('excel.xlsx', index=False)
print('数据已成功保存到excel.xlsx文件中')
# 保存为mart.dat文件
df.to_csv('mart.dat', index=False, sep='\t')
print('数据已成功保存到mart.dat文件中')
else:
print('未找到数据')