万能的站长,我想用python抓取这几个数据,请教该怎么写法

查看 176|回复 17
作者:请叫我黄先生   
import requests
# 第二步搭建网络请求浏览器信息
headers={
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/557.37 (KHTML, like Gecko) Chrome/147.0.0.0 Safari/557.37'
}
[size=13.0667px]# 第三步访问对应网页url = 'https://seo.chinaz.com/www.huaer.net'# 第四步请求返回对应网页信息response = requests.get(url)# 第五步打印返回网页信息print(response.text)[size=13.0667px]
[size=13.0667px]# 第六步获取数据[size=13.0667px]


image.png (305.24 KB, 下载次数: 0)
下载附件
保存到相册
半小时前 上传

网页, 写法

Believe   
不懂,蹲一个大佬
笨蛋天才   
不懂请教大佬吧
loren   
楼下有大佬
北漂少年历险记   
抓这个干嘛呢
请叫我黄先生
OP
  
北漂少年历险记 发表于 2023-10-12 14:26
抓这个干嘛呢

学习一下

ACNWI6i   

不懂,帮顶
我思故我在   
我记得站长老五是懂代码的

对三,要不起   
简单啊,requests抓取页面源码,from lxml import etree,再对源码进行xml解析,html=etree.HTML(res.text),这个全部都有id,直接xpath(id),用text()获取就可以了


image.png (42.43 KB, 下载次数: 0)
下载附件
保存到相册
半小时前 上传
请叫我黄先生
OP
  
对三,要不起 发表于 2023-10-12 14:28
简单啊,requests抓取页面源码,from lxml import etree,再对源码进行xml解析,html=etree.HTML(res.text),这个全部都有id,直接xpath(id),用text()获取就可以了

大佬,方便写一下完整的代码吗,学习下

您需要登录后才可以回帖 登录 | 立即注册

返回顶部