服务器被蜘蛛爬死了怎么办?使用技巧之nginx拦截爬虫的方法

查看 16|回复 1
作者:猎人发财   
当我们网站遇到搜索引擎爬虫过度爬取、或者被CC攻击时,就出现服务器资源被占满,
网站打开就会比较慢甚至打不开。在不升级服务器的情况下,可以尝试屏蔽掉一些不需要的爬虫。
今天教大家如何分析和拦截不需要的爬虫抓取我们网站的数据。我们还是以宝塔面板为例。
第一步:打开web日志


5fadf3b4658b7.jpg (26.11 KB, 下载次数: 0)
下载附件
保存到相册
昨天23:21 上传

第二步:找到使用的网站域名点后面的编辑


5fadf3dca54da.jpg (54.86 KB, 下载次数: 0)
下载附件
保存到相册
昨天23:22 上传

第三步:分析日志
主要是找出爬虫的特征,根据特征拦截
如下图


5fa4441.jpg (161.06 KB, 下载次数: 0)
下载附件
保存到相册
昨天23:23 上传

第四步:设置拦截规则
if ($http_user_agent ~ semrush.com) {return  403 ;}


QQ20260319-233340.png (183.68 KB, 下载次数: 0)
下载附件
保存到相册
昨天23:34 上传

一下是看你是PHP几,就打开几,在文件上面加入屏蔽垃圾蜘蛛。
屏蔽代码综合代码文件如下:
通过网盘分享的文件:使用技巧之nginx拦截爬虫的方法
链接: https://pan.baidu.com/s/1ka9C1UZkNsS3b5IpR0yWOA?pwd=as3e 提取码: as3e
迅雷云盘下载
https://pan.xunlei.com/s/VOo5hQwsTn1as-_pNWKh95NpA1?pwd=4sgf#

爬虫, 下载次数

兔兔侠   
放弃抵抗吧~  几百个域名站的我 已经全改成单页了!
-----------------------------------------
目前标配:8H8G30M +1个单页绑定几百个域名(单页内容:兔兔侠)

-----------------------------------------
转移战场,不搞站了
您需要登录后才可以回帖 登录 | 立即注册

返回顶部