大佬勿喷,多给些鼓励和建议,嘻嘻
网站url: https://bing.ioliu.cn/
用到的库:requests pyquery time
第一步:添加用到的库
1671068693101.jpg (15.73 KB, 下载次数: 0)
下载附件
2022-12-15 09:44 上传
第二步:请求到网页拿到源码,就是加了个代{过}{滤}理ip,和请求头(本来想用params添加cookics 和 请求头来着,访问了一下拿不到源码),只加请求头就拿到源码了,有点奇怪。
image.png (31.42 KB, 下载次数: 0)
下载附件
2022-12-15 10:06 上传
第三步:解析源码pyquery真的好简单,直接拿到图片的链接在img的src里,
[color=]有个地方注意一下
直接拿img会多出一条来里边没有src,直接拿img加上class的内容会取不到内容,所以就先取了div又拿到的img
image.png (37.91 KB, 下载次数: 0)
下载附件
2022-12-15 09:53 上传
最后一步:保存和防封ip,都很简单,防封就是让程序休息几秒,刚开始也没什么数就随便写了个2
image.png (30.02 KB, 下载次数: 0)
下载附件
2022-12-15 10:00 上传
自动翻页的代码没加(思路就是查看每页的url得到之间的关系,拼出url再在最外边套一层循环),昨天学了pymongo数据库后期会存到数据库里,到此程序就完成了,这是我分析的第一个网站,在此纪念一下,感谢52pojie论坛给我的知识和分享的喜悦,
1671080955221.png (22.11 KB, 下载次数: 0)
下载附件
2022-12-15 13:08 上传