【求助】百度抓取问题

作者：么么踹发布时间：2023-9-22 15:01:37

网站只有2个目录A目录和B目录，这个时候生成了一个页面，给他的id是111，并且分配到A目录，这个时候https:/XXXX/A/111.html打开是正常的，百度蜘蛛过来抓取也是正常的；但是百度蜘蛛也顺道自己抓取了一个https:/XXXX/B/111.html，因为这个页面的id只分配到了A目录，百度蜘蛛如果抓取到B目录，B目录是没有这个id的，势必会导致百度蜘蛛过来抓取的B目录的111.html是404
如果再在A目录产生了一个页面id是222
百度蜘蛛会抓取https:/XXXX/A/222.html还有https:/XXXX/B/222.html（因为B目录没有id222,所以这个页面百度蜘蛛过来抓取是404）
类推就是产生了10个页面，蜘蛛会抓取20次，A目录抓取10次，B目录抓取10次，但是在B目录的都是抓取的404.
这种有没有大佬可以解决的啊！

目录, 蜘蛛

相关帖子

笨蛋天才 2023-9-22 15:02:36

没碰到过呢

Believe 2023-9-22 15:03:23

看不懂。

制心一处 2023-9-22 15:03:56

你难为住我了，我想我语文老师了

bailu 2023-9-22 15:04:39

为什么会抓取b目录？这个顺道是顺的什么道？不想让他抓取b目录直接robots禁止不就行了？

胖子 2023-9-22 15:05:23

主要是百度蜘蛛为什么会爬到B/111.HTML?检查一下哪里的问题

小蝌蚪 2023-9-22 15:06:07

不用管给不同目录整上相同的id就行了泛目录就这个原理

缪斯的情人 2023-9-22 15:07:03

不用管的，蜘蛛只会去

【求助】百度抓取问题

相关帖子

浏览过的版块

热门主题

最近发现一个挺上头的小游戏系列： Escape

pdf2any 文字版 PDF 转 md,html,docx，表格

推荐几个cps联盟给大家，希望大家都能赚到

一个连收录都没有的站都会被盯上？

TransOne： macOS 原生菜单栏翻译工具

2026 开一个公司，经验分享篇

微软 2FA 好像可以云备份了

大佬们，现在哪种cms程序自动采集还能快速

胡润财富报告：全国每100户家庭中就有一户

做一个怀旧网，卖一些怀旧老物件，大家觉得

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

【求助】百度抓取问题

相关帖子

浏览过的版块

热门主题

最近发现一个挺上头的小游戏系列： Escape

pdf2any 文字版 PDF 转 md,html,docx，表格

推荐几个cps联盟给大家，希望大家都能赚到

一个连收录都没有的站都会被盯上？

TransOne： macOS 原生菜单栏翻译工具

2026 开一个公司，经验分享篇

微软 2FA 好像可以云备份了

大佬们，现在哪种cms程序自动采集还能快速

胡润财富报告：全国每100户家庭中 就有一户

做一个怀旧网，卖一些怀旧老物件，大家觉得

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

胡润财富报告：全国每100户家庭中就有一户

在 Yoo趣儿投放广告