百度是不是上线了很多其他未知的蜘蛛

查看 144|回复 10
作者:無剑   
遇到了一个比较奇怪的现象,一个站昨天收录放出了40多条内页,但是蜘蛛才13条,放出的内页更新时间都是昨天的。注:放出的内页更新时间都在计算时间内,不存在说是前天抓取的情况。
下面是宝塔上的蜘蛛统计和自写的蜘蛛统计工具 都对应的上。
百度是不是上线了很多其他ip段的蜘蛛,有了解的分享下来


image.png (54.34 KB, 下载次数: 0)
下载附件
保存到相册
3小时前 上传



image.png (112.77 KB, 下载次数: 0)
下载附件
保存到相册
3小时前 上传

蜘蛛, 更新时间

小千   
蜘蛛今天抓的,获取到到时间因子,也显示昨天时间,按照昨天时间显示
無剑
OP
  
小千 发表于 2023-3-13 18:49
蜘蛛今天抓的,获取到到时间因子,也显示昨天时间,按照昨天时间显示

我日。。。。。是这个道理。。。我还以为又上线了其他ip段。。。那个多少小时前就是更新时间,不是快照时间了。。。。
小千   
無剑 发表于 2023-3-13 18:50
我日。。。。。是这个道理。。。我还以为又上线了其他ip段。。。那个多少小时前就是更新时间,不是快照时间了。。。。


对 以前快照在的时候,快照时间是蜘蛛抓取时间,百度显示时间是获取页面的时间因子
無剑
OP
  
小千 发表于 2023-3-13 18:55
对 以前快照在的时候,快照时间是蜘蛛抓取时间,百度显示时间是获取页面的时间因子



来个人试试把更新时间改为动态即访问时间试试,看是啥效果

平凡的人生   
無剑 发表于 2023-3-13 18:56
来个人试试把更新时间改为动态即访问时间试试,看是啥效果

那方法等死吧,我玩过,很快网站就死了。
前方   
没有吧,百度出了很多欺骗蜘蛛你不知道吧
無剑
OP
  
平凡的人生 发表于 2023-3-13 19:05
那方法等死吧,我玩过,很快网站就死了。





小千   
無剑 发表于 2023-3-13 18:56
来个人试试把更新时间改为动态即访问时间试试,看是啥效果

百度以前时间因子刚出时候,可以作弊 ,那时候有人把时间内容改成了2030年哈哈哈
新程序已上线   
百度新增了很多ip段,还增加了不带蜘蛛ua的请求,目前无法判断是否为抓取蜘蛛,总之百度ip段的无厘头请求,还有不是百度ip段的更是无厘头请求,看到谜一样的收录数据对比蜘蛛情况,完全懵逼状态
您需要登录后才可以回帖 登录 | 立即注册

返回顶部