python爬虫三国杀十周年

[Python] 纯文本查看复制代码import urllib.request
from lxml import etree
import json
# https://www.sanguosha.com/msgs/mWallPaper
# https://www.sanguosha.com/msgs/mWallPaper/cur/2
# https://www.sanguosha.com/msgs/mWallPaper/cur/3
def get_content(page):
headers = {
      "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) "
                  "Chrome/115.0.0.0 Safari/537.36"}
if page == 1:
      first_url = "https://www.sanguosha.com/msgs/mWallPaper"
      request_first = urllib.request.Request(url=first_url, headers=headers)
      response = urllib.request.urlopen(request_first)
      content_first = response.read().decode("utf-8")
      num = 0
      tree = etree.HTML(content_first)
      https_list = tree.xpath("/html/body/div[1]/div/div//@href")
      for i in range(len(https_list)):
         url = https_list
         num += 1
         urllib.request.urlretrieve(url=url, filename="D:/三国杀十周年壁纸/" + "00" + str(num) + ".jpg")
else:
      url = "https://www.sanguosha.com/msgs/mWallPaper/cur/" + str(page)
      request = urllib.request.Request(url=url, headers=headers)
      response = urllib.request.urlopen(request)
      content = response.read().decode("utf-8")
      with open("三国杀十周年壁纸爬虫.json", "w", encoding="utf-8") as file:
         file.write(content)
def json_data():
json_file = json.load(open("三国杀十周年壁纸爬虫.json", "r", encoding="utf-8"))
for i in range(len(json_file)):
      https_data = json_file["imgurl"]
      name = json_file["title"].replace("*", "-")
      urllib.request.urlretrieve(url=https_data, filename="D:/三国杀十周年壁纸/" + name + ".jpg")
if __name__ == '__main__':
begin_page = int(input("请输入起始页码："))
end_page = int(input("请输入起始结束："))
for page in range(begin_page, end_page + 1):
      get_content(page)
      json_data()
十周年, 爬虫

python爬虫三国杀十周年

相关帖子

热门主题

国产英伟达，摩尔把上市融资的75亿元拿去买

✅DMIT 三网 GIA CMIN2 MALIBU EB 维多利亚

有MJJ遇到过TG号全部设备都被登出了吗？

【快讯】HostHatch Seoul HH 新节点首尔

Hk-One-0.5G-52-LS 少量放貨速度

公司项目分享：硅谷人工智能公司 Nexa AI

拿到了 300 来部短剧的海外发行版权，下一

长话短说大家觉得花三十万结婚，存款花完

建议拉黑 IObit 旗下所有软件

重度苹果用户投华做了两面派

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

python爬虫三国杀十周年

相关帖子

热门主题

国产英伟达，摩尔把上市融资的75亿元拿去买

✅DMIT 三网 GIA CMIN2 MALIBU EB 维多利亚

有MJJ遇到过TG号全部设备都被登出了吗？

【快讯】HostHatch Seoul HH 新节点 首尔

Hk-One-0.5G-52-LS 少量放貨 速度

公司项目分享：硅谷人工智能公司 Nexa AI

拿到了 300 来部短剧的海外发行版权，下一

长话短说 大家觉得花三十万结婚，存款花完

建议拉黑 IObit 旗下所有软件

重度苹果用户投华做了两面派

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

【快讯】HostHatch Seoul HH 新节点首尔

Hk-One-0.5G-52-LS 少量放貨速度

长话短说大家觉得花三十万结婚，存款花完

在 Yoo趣儿投放广告