Python爬取wallhaven壁纸

作者：Greennova 发布时间：2023-1-31 23:00:17

学习中，未加多线程，由于网站、图片大小等因素导致下载缓慢
望各位大神提出建议并加以修善
网站主页及其爬取页如下，可自行修改代码中的url变量已及爬取页数

image.png (1.77 MB, 下载次数: 0)
下载附件
2023-1-31 19:03 上传

image.png (2.18 MB, 下载次数: 0)
下载附件
2023-1-31 19:04 上传

源码如下
[Python] 纯文本查看复制代码import requests
from lxml import etree
for x in range(2,5): #爬取页数
n=0 #name initialize of picture
url = f"https://wallhaven.cc/toplist?page={x}"
headers1 = {
      'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
      }
response = requests.get(url=url,headers=headers1)
#print(response.text)
tree = etree.HTML(response.text)
list = tree.xpath('//*[@id="thumbs"]/section[1]/ul/li/figure/a/@href')
response.close()
def repage(url1,n):
      response1 = requests.get(url = url1,headers=headers1)
      tree1 = etree.HTML(response1.text)
      src_url = tree1.xpath('//*[@id="wallpaper"]/@src')
      for j in src_url:
         response_img = requests.get(j)
      print(response_img)
      with open('img//'+'wallhaven//'+str(n)+'.jpg', mode="wb") as f:
         f.write(response_img.content) #二进制存入图片
      print("Done!")
      response_img.close()
      response1.close()
for i in list:
      n=n+1
      repage(i,n) #本页图片获取

下载次数, 加多

相关帖子

李玉风我爱你 2023-1-31 23:00:56

yuwen998 发表于 2023-1-31 19:10
老师好！能否搞个汉化版本的PyCharm？谢谢
pycharm不是自带中文吗装个语言包就行
在应用中，点击左上角的file选项。
打开setting选项。
在搜索框中，输入chinese进行搜索，找到简体中文选项，点击install按钮，进行安装。
安装好了之后，就可以将应用设置为中文。

yuwen998 2023-1-31 23:01:41

我下载了好多个PyCharm ，里面都不含中文汉化，真的感到奇怪，按网上所说的去操作都没有，下载汉化包覆盖了也是没有汉化内容！如果那位网友有汉化的PyCharm ，请上传一个！在此先谢谢

yuwen998 2023-1-31 23:02:32

老师好！能否搞个汉化版本的PyCharm？谢谢

fengyexue 2023-1-31 23:03:24

楼主发的这个儿很有见地支持一下啊

tomhex 2023-1-31 23:04:08

感谢分享，学习了

ysjd22 2023-1-31 23:04:51

学习一下。谢谢楼主

shicoco 2023-1-31 23:05:47

这东西还算可以。

jingyan96 2023-1-31 23:06:43

学习一下。谢谢楼主

jingyan96 2023-1-31 23:07:43

楼主是单独学习的 python的爬虫这一小块吗? 学习的是哪个教程？

Python爬取wallhaven壁纸

相关帖子

热门主题

最近收BA的人很多交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了建了一个群想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

Python爬取wallhaven壁纸

相关帖子

热门主题

最近收BA的人很多 交易了要立刻取消BA 教训

刚看了一个视频，让我又清醒了一下

小小农民新开中转站，欢迎来踩

港版安卓机是满血的国际版安卓机吗？

我 ThreeJSON 又回来了： V 友们批评得对！

继之前 5.4 的 “收口”之后， 5.6 Sol 好

折腾 homelab 挺长时间了 建了一个群 想不

codex 打开风扇狂转怎么办

Vibe 的一个中文起名小工具

你们明天要去看周星驰的电影么？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

最近收BA的人很多交易了要立刻取消BA 教训

折腾 homelab 挺长时间了建了一个群想不

在 Yoo趣儿投放广告