如何识别爬虫和无头浏览器的流量

查看 249|回复 9

作者：main1234 发布时间：2024-5-9 17:04:26

佬们，网站一直被爬，怎么能识别出是爬虫呢？？？并且现在根本防止不了无头浏览器，想实现是无头唤起的页面就提示页面不安全

Features 2024-5-9 17:04:57

抖音,小红书,拼多多这三个国内最强防爬团队,都防不住爬虫
只能增加一点防爬成本,比如进入页面加个谷歌验证码什么的
但是体验就差了不是...
识别了无头浏览器,那就用有头的爬
不行就直接抓你的 api,总有办法的

zhtyytg 2024-5-9 17:05:44

老话说得好：只有千日做贼，哪有千日防贼

ajaxgoldfish 2024-5-9 17:06:41

逆向圈有一个梗，拿着一万的工资的程序员对抗三万工资的逆向 er

czfy 2024-5-9 17:07:32

上 cloudflare

chanChristin 2024-5-9 17:08:08

无头浏览器？那不就是爬虫吗，直接 b 了拉倒。

mumbler 2024-5-9 17:08:41

数据真的很宝贵的话，强制要求登录，然后根据日志封账号，注册账号需要邀请，邀请需要 1 个金币

duan602728596 2024-5-9 17:09:33

抖音是加验证码，而且用户主页是必出验证码。
小红书是验证码和对 url 加密，加密算法会对浏览器环境进行判断，node 和无头浏览器算出来的加密结果是错误的。
对于爬虫的请求，一般都是验证 UA 、Host 、Referer ，对 url 加密。
无头浏览器环境会有 navigator.webdriver: true 。
以前有个 app ，直接对 POST 请求的 body 加密后用 gzip 来压缩和解压缩，这也是一个思路。

duan602728596 2024-5-9 17:10:29

@duan602728596 更正，是 zlib

krapnik 2024-5-9 17:11:19

无头：
https://infosimples.github.io/detect-headless/
协议：
增加逆向成本

如何识别爬虫和无头浏览器的流量

浏览过的版块

热门主题

单兵作战的后端，如何在这种全员乱改代码的

几个出海工具 IDEA

昆明的三九手机网，一个卖手机的扩展了这么

你们工作以来都跳过几次槽，每家都待了多长

以后如何买美股？

cf 优选是必须先有 saas 功能吗？

请问，这种该如何屏蔽？可以屏蔽某一个节点

无损音乐只能一首一首的下吗？有没有批量下

微信开放平台发布AI生态接入指引，小程序可

快快服务器有拼团的吗？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

如何识别爬虫和无头浏览器的流量

浏览过的版块

热门主题

单兵作战的后端，如何在这种全员乱改代码的

几个出海工具 IDEA

昆明的三九手机网，一个卖手机的扩展了这么

你们工作以来都跳过几次槽，每家都待了多长

以后如何买美股？

cf 优选是必须先有 saas 功能吗？

请问，这种该如何屏蔽？可以屏蔽某一个节点

无损音乐只能一首一首的下吗？有没有批量下

微信开放平台发布AI生态接入指引，小程序可

快快服务器有拼团的吗？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

在 Yoo趣儿投放广告