Python爬取优美小姐姐

作者：Greennova 发布时间：2023-2-2 20:00:23

1.爬取网站

image.png (51.68 KB, 下载次数: 0)
下载附件
2023-2-2 19:07 上传

image.png (1.09 MB, 下载次数: 0)
下载附件
2023-2-2 19:05 上传

2.前言
①本人作为一名初学者，爬取网页仅做学习
②代码仅供参考，多有不足望指教
③可自行更换爬取始末页以及某页中图片的爬取始页，代码中有注释
④需要在项目路径下自己创建爬取图片保存路径，如代码所示
3.源码如下
[Python] 纯文本查看复制代码import requests
from lxml import etree
import time
url = "https://www.umei.cc/meinvtupian/meinvxiezhen/"
for x in range(2,30):#这里自行更改始末页
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36"}
url2 = f"https://www.umei.cc/meinvtupian/meinvxiezhen/index_{x}.htm"
response = requests.get(url2,headers = headers)
response.encoding = 'utf-8'
#print(response.text)
tree = etree.HTML(response.text)
list_href = tree.xpath('//*[@id="infinite_scroll"]/div[30]/div[1]/div/a/@href')#可更该代码中30部分，换成30以下的数字，这里是某页中爬取图片的开始
#print(list_href)
#re_list_href = reversed(list_href)
bottom_url = list_href[0].split('/')[-1]
url_add = url + bottom_url
#print(url_add)
response1 = requests.get(url_add, headers=headers)
response1.encoding = 'utf-8'
#print(response1.text)
list_link = 1
n=0
while list_link:
      tree = etree.HTML(response1.text)
      top_name = tree.xpath('//*[@id="photos"]/h1/text()')
      #top_name = name[0].split('，')[0]
      #print(top_name[0])
      list_src = tree.xpath('/html/body/div[3]/div[2]/div[6]/a/img/@src')
      print(list_src[0])
      response_img = requests.get(list_src[0],headers)
      with open('img//'+'meinv//'+top_name[0]+str(n)+'.jpg',mode='wb') as f: #这里要创建该路径
         f.write(response_img.content)
      print("Done!",top_name[0]+str(n))
      list_link = tree.xpath('/html/body/div[3]/div[2]/div[6]/a/@href')
      bottom_url1 = list_link[0].split('/')[-1] #这里是取链接中最后的参数
      url_add1 = url + bottom_url1
      #print(url_add1)
      response1 = requests.get(url_add1, headers=headers)
      response1.encoding = 'utf-8'
      n=n + 1 #这里是图片有组图，加上不同的n命名
response_img.close()
response1.close()
response.close()
4.效果展示

image.png (937.08 KB, 下载次数: 0)
下载附件
2023-2-2 19:23 上传

下载次数, 代码

Python爬取优美小姐姐

相关帖子

浏览过的版块

热门主题

ioio事件是什么鬼？

养老贷又来了，贷贷相传啊

今天要撸2次

好评有礼给的是红包还是优惠卷

现在干啥都太难了，珍惜吧

淘宝现在也好难搞啊

现在的ai能生产图文结合的内容吗

周固固突然发飙了，谁惹他了呢？吃光群众等

怎么吵架了啊

老坛们看过来，周固固同志狂撒金币。折射一

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

Python爬取优美小姐姐

相关帖子

浏览过的版块

热门主题

ioio事件是什么鬼？

养老贷又来了，贷贷相传啊

今天要撸2次

好评有礼给的是红包还是优惠卷

现在干啥都太难了，珍惜吧

淘宝现在也好难搞啊

现在的ai能生产图文结合的内容吗

周固固突然发飙了，谁惹他了呢？吃光群众等

怎么吵架了啊

老坛们看过来，周固固同志狂撒金币。折射一

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

在 Yoo趣儿投放广告