如何识别爬虫和无头浏览器的流量

查看 58|回复 9
作者:main1234   
佬们,网站一直被爬,怎么能识别出是爬虫呢???并且现在根本防止不了无头浏览器,想实现是无头唤起的页面就提示页面不安全
Features   
抖音,小红书,拼多多这三个国内最强防爬团队,都防不住爬虫
只能增加一点防爬成本,比如进入页面加个谷歌验证码什么的
但是体验就差了不是...
识别了无头浏览器,那就用有头的爬
不行就直接抓你的 api,总有办法的
zhtyytg   
老话说得好:只有千日做贼,哪有千日防贼
ajaxgoldfish   
逆向圈有一个梗,拿着一万的工资的程序员对抗三万工资的逆向 er
czfy   
上 cloudflare
chanChristin   
无头浏览器?那不就是爬虫吗,直接 b 了拉倒。
mumbler   
数据真的很宝贵的话,强制要求登录,然后根据日志封账号,注册账号需要邀请,邀请需要 1 个金币
duan602728596   
抖音是加验证码,而且用户主页是必出验证码。
小红书是验证码和对 url 加密,加密算法会对浏览器环境进行判断,node 和无头浏览器算出来的加密结果是错误的。
对于爬虫的请求,一般都是验证 UA 、Host 、Referer ,对 url 加密。
无头浏览器环境会有 navigator.webdriver: true 。
以前有个 app ,直接对 POST 请求的 body 加密后用 gzip 来压缩和解压缩,这也是一个思路。
duan602728596   
@duan602728596 更正,是 zlib
krapnik   
无头:
https://infosimples.github.io/detect-headless/
协议:
增加逆向成本
您需要登录后才可以回帖 登录 | 立即注册

返回顶部