记一次爬马蜂窝的心酸历程

查看 36|回复 1
作者:展昭857   
省流,直接给结论
"
"
"
"
"

那么怎么解决呢?
【有钱人的方案】
采用python+v8扩展,可以参考另外大神 分析过程 https://blog.csdn.net/YungGuo/article/details/109818327,以及代码样本 https://github.com/YungGuo08/WebSpider/tree/master/cookie_analysis/1
IP呢? 免费的http代理不靠谱,花钱找一个服务商提供代理池,你得同时要解决每个IP应该需要爬取多少个http请求,不然会进入403被封IP的禁地
【穷人的方案】
PC+chrome+F12,手动抓取__jsluid_s + __jsl_clearance_s,
如果出现403,让爬虫等待30分钟,接着干活

对于我本人,哈哈,当然属于穷人一列了。


image.png (317.35 KB, 下载次数: 0)
下载附件
保存到相册
9分钟前 上传

最后问问各位大佬, 已经BA老域名,怎么能快速被百毒尽快收录,或者也可以私信我,51cdu.com 友情链接一下(要求必须BA)

马蜂窝, 爬虫

赵启元   
点赞,谢谢分享
您需要登录后才可以回帖 登录 | 立即注册

返回顶部