练习爬虫,搞不定翻页网址,求助大神

查看 62|回复 5
作者:fengwolf3   
本人在练习爬虫,爬取本地酒店信息,但是对于网页的第一页地址,没办法搞定,下一页控件地址没办法搞定,“下一页”框这个元素会变来变去点不了
网址初始地址为:https://www.elong.com/hotel/hotellist?pageSize=20&t=1695781847322&city=1409&inDate=2023-09-27&outDate=2023-09-28&filterList=8888_1
求助大神帮忙把查到934 家酒店满足条件的分页地址帮我获取一下
用数组形式表示
[
{"url":"首页地址"},
{"url":"第2页地址"},
{"url":"第3页地址"},
{"url":"第4页地址"},
{"url":"第5页地址"},
{"url":"第6页地址"},
{"url":"第7页地址"},
{"url":"第8页地址"},
.....

地址, 爬虫

我今天是大佬   

酒店地址就是前面的拿到
拼接上这个
https://www.elong.com/hotel/hoteldetail?hotelId=41409016
hotelId就是酒店地址. 前面分页接口拿到的
话说回来, 如果还是不懂的话, 我建议你学习不要越级过快, 要适度前行, 先看看别人怎么写, 把基础处理好
我今天是大佬   

分页地址就是
https://www.elong.com/tapi/v2/list?pageSize=20&t=1695781847322&city=1409&inDate=2023-09-27&outDate=2023-09-28&filterList=8888_1&pageIndex=2&sugActInfo=&traceToken=%7C*%7CcityId:1409%7C*%7CqId:559f48b4-dc7a-4e94-801f-6004e3d8e26b%7C*%7Cst:city%7C*%7CsId:1409%7C*%7Cscene_ids:0%7C*%7Csmz:C%7C*%7Cbkt:r3%7C*%7C
至于最后一个参数traceToken就比较难搞了, 所以
fengwolf3
OP
  


我今天是大佬 发表于 2023-9-27 10:51
分页地址就是
https://www.elong.com/tapi/v2/list?pageSize=20&t=1695781847322&city=1409&inDate=2023-0 ...

请问大神,这个要怎么用?
我今天是大佬   

粘贴到浏览器的地址栏 就能返回数据了
用这个地址, 变化的最后一个数字就是第几页面
第三页
https://www.elong.com/tapi/v2/list?pageSize=20&t=1695781847322&city=1409&inDate=2023-09-27&outDate=2023-09-28&filterList=8888_1&pageIndex=3
第四页
https://www.elong.com/tapi/v2/list?pageSize=20&t=1695781847322&city=1409&inDate=2023-09-27&outDate=2023-09-28&filterList=8888_1&pageIndex=4
第五页
https://www.elong.com/tapi/v2/list?pageSize=20&t=1695781847322&city=1409&inDate=2023-09-27&outDate=2023-09-28&filterList=8888_1&pageIndex=5
fengwolf3
OP
  


我今天是大佬 发表于 2023-9-27 11:01
粘贴到浏览器的地址栏 就能返回数据了
用这个地址, 变化的最后一个数字就是第几页面

嗯嗯 ,您是直接把接口数据给我了哈,但是我还有一个需求就行要点进每个酒店看详情页,需要里面的房间数,如果没有链接,就没办法进入详情页,请问还有没办法?
按照你给的黏贴到地址栏指返回酒店信息,没有酒店链接
您需要登录后才可以回帖 登录 | 立即注册

返回顶部