蜘蛛304是什么意思

查看 153|回复 10
作者:QQnD2q9   


sdasda.jpg (26.66 KB, 下载次数: 0)
下载附件
保存到相册
半小时前 上传

大部分抓取的都是304

蜘蛛, 都是

小李0005   
客户端在请求一个文件的时候,发现自己缓存的文件有 Last Modified ,那么在请求中会包含 If Modified Since ,这个时间就是缓存文件的 Last Modified 。因此,如果请求中包含 If Modified Since,就说明已经有缓存在客户端。服务端只要判断这个时间和当前请求的文件的修改时间就可以确定是返回 304 还是 200 。
第二次抓取同一个页面 就是304的状态码
如果第二次抓取同一个页面 页面内容发生的变化 就是 200的状态码
QQnD2q9
OP
  
小李0005 发表于 2023-3-20 09:14
客户端在请求一个文件的时候,发现自己缓存的文件有 Last Modified ,那么在请求中会包含 If Modified Since ,这个时间就是缓存文件的 Last Modified 。因此,如果请求中包含 If Modified Since,就说明已经有缓存在客户端。服务端只要判断这个时间和当前请求的文件的修改时间就可以确定是返回 304 还是 200 。
第二次抓取同一个页面 就是304的状态码
如果第二次抓取同一个页面 页面内容发生的变化 就是 200的状态码

就是蜘蛛发现页面没变化就不来抓了
小李0005   
就像我们第一次打开 4414的首页 就是200状态码
第二再次打开 4414首页。首页内容没有变化  就会直接读取浏览器缓存 状态码就是 304
小李0005   
QQnD2q9 发表于 2023-3-20 09:16
就是蜘蛛发现页面没变化就不来抓了

不是的
蜘蛛会抓取已经收录的页面  看看内容有没有产生变化
QQnD2q9
OP
  
小李0005 发表于 2023-3-20 09:18
不是的
蜘蛛会抓取已经收录的页面  看看内容有没有产生变化

要不要管他,
小李0005   
QQnD2q9 发表于 2023-3-20 09:19
要不要管他,

不用,对你没有任何影响
QQnD2q9
OP
  
小李0005 发表于 2023-3-20 09:19
不用,对你没有任何影响

号,谢谢
小李0005   
就跟这个你写的帖子一样。首次被百度收录 百度第一次抓取时候就是 200状态码
过了几天你又修改的帖子内容。 百度再次抓取 对比之前百度收录的内容发生了变化 状态码 也是200。 百度再次抓取你没有修改内容就是 304
小李0005   
百度会时不时的重复抓取已经收录的页面 看看内容有没有更新或变动
没有更新就是 304读取原来缓存的状态码
更新了就是 200 状态码
您需要登录后才可以回帖 登录 | 立即注册

返回顶部