批量抓取公众号,下载公众号话图片

查看 89|回复 6
作者:fei5788   
[Asm] 纯文本查看 复制代码import requests
import re
# 输入话题链接
topic_url = input("请输入话题链接:")
# 提取__biz和album_id参数
biz = re.search(r'__biz=(.*?)&',topic_url).group(1)
album_id = re.search(r'album_id=(.*?)&',topic_url).group(1)
# 构造请求头
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'
}
# 发送请求获取网页源代码
response = requests.get(topic_url, headers=headers)
# 使用正则表达式匹配出图片链接和标题
img_links = re.findall('data-src="(.*?)"',response.text)
titles = re.findall('data-title="(.*?)"',response.text)
# 遍历标题和图片链接,下载图片并保存
print("正在下载图片...")
for i,j in zip(titles,img_links):
    img_url = j.replace("amp;","")
    img_data = requests.get(img_url,headers=headers)
    with open(i+'.jpg','wb') as f:
        f.write(img_data.content)
print("下载完成!")
原帖:批量抓取公众号,下载公众号话题音频和视频 - 『编程语言区』 - 吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn
看完以后自己写了一个,大神帮提提意见

公众, 批量

xzdatm   

公众号没有啥加密么佬,还是说这个话题是啥样的话题,纯打听打听
oxmxw   

感谢分享!
KevinDing   

感谢分享
孽小帅才   

图片不会失效,所以通常没保存的必要,我一般是利用pandoc转格式的时候顺便保存下来
c103559   

有些东西收费的。有办法抓取么
孽小帅才   

厉害啊感谢
您需要登录后才可以回帖 登录 | 立即注册

返回顶部