import re
# 输入话题链接
topic_url = input("请输入话题链接:")
# 提取__biz和album_id参数
biz = re.search(r'__biz=(.*?)&',topic_url).group(1)
album_id = re.search(r'album_id=(.*?)&',topic_url).group(1)
# 构造请求头
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
}
# 发送请求获取网页源代码
response = requests.get(topic_url, headers=headers)
# 使用正则表达式匹配出图片链接和标题
img_links = re.findall('data-src="(.*?)"',response.text)
titles = re.findall('data-title="(.*?)"',response.text)
# 遍历标题和图片链接,下载图片并保存
print("正在下载图片...")
for i,j in zip(titles,img_links):
img_url = j.replace("amp;","")
img_data = requests.get(img_url,headers=headers)
with open(i+'.jpg','wb') as f:
f.write(img_data.content)
print("下载完成!")
原帖:批量抓取公众号,下载公众号话题音频和视频 - 『编程语言区』 - 吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn
看完以后自己写了一个,大神帮提提意见