万能的站长,我想用python抓取这几个数据,请教该怎么写法

查看 88|回复 5
作者:请叫我黄先生   
对三,要不起 发表于 2023-10-12 15:13
import requests
from lxml import etree
url = 'https://www.aizhan.com/cha/baidu.com/'
headers = {
    "User-Agent": 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36 Edg/115.0.1901.200',
}
res = requests.get(url, headers=headers)
html = etree.HTML(res.text)
pcWords = html.xpath('//*[@id="cc1"]/text()')
wapWords = html.xpath('//*[@id="cc2"]/text()')
shoulu3_1days = html.xpath('//*[@id="shoulu3_1days"]/text()')
shoulu3_7days = html.xpath('//*[@id="shoulu3_7days"]/text()')
shoulu3_30days = html.xpath('//*[@id="shoulu3_30days"]/text()')
print('PC词数:' + pcWords[0])
print('wap词数:' + wapWords[0])
print('24词数:' + shoulu3_1days[0])
print('7天词数:' + shoulu3_7days[0])
print('30天词数:' + shoulu3_30days[0])

大佬,请教一下如果换成网址:https://seo.chinaz.com/,站长工具该怎么写法

词数, 写法

对三,要不起   
请叫我黄先生 发表于 2023-10-12 15:20
大佬,请教一下如果换成网址:https://seo.chinaz.com/,站长工具该怎么写法

url后面的baidu.com换成你要抓取的网址就行了,不要带http,直接域名就行了
小冯他爸   
白嫖最高境界学习?
请叫我黄先生
OP
  
小冯他爸 发表于 2023-10-12 15:23
白嫖最高境界学习?

大家一起学习下

nixi2021   
不懂技术,等大佬来
李小轩   
不会帮顶
您需要登录后才可以回帖 登录 | 立即注册

返回顶部