这是我目前见过最牛叉的采集站

查看 167|回复 19
香菜不香   
采集是防不了的
小贝   


image.png (812.76 KB, 下载次数: 0)
下载附件
保存到相册
前天22:04 上传

  我抓包看了一理,确实 是反向代理按头条规则把图片重写了一次,这个思路很6。但是,如果回源,是不是可以发现问题了.
小贝   
一针见血 发表于 2023-6-12 21:54
这个反向代理  并非本地图片 链接是302

确实是的,按头条规则 做的反向代理,这个思路也是6了,但是,蜘蛛发现了问题吗?
一针见血   
小贝 发表于 2023-6-12 22:06
确实是的,按头条规则 做的反向代理,这个思路也是6了,但是,蜘蛛发现了问题吗?

蜘蛛抓取 算本地图片  
易客   
其实直接采集他的下一篇文章就可以一直采集了啊


一针见血   
易客 发表于 2023-6-12 22:50
其实直接采集他的下一篇文章就可以一直采集了啊

只能一部分  上下篇 id 不连续  也是采集不全
易客   
一针见血 发表于 2023-6-12 22:51
只能一部分  上下篇 id 不连续  也是采集不全

不用连续撒,一直连接他的下一篇,图片估计搞不了,就有自己配图
wkcm   
这是内部员工搞的,百度从骨子里烂透了,就这垃圾站,连个分页都没有,哪里符合好网站的标准?
一针见血   
易客 发表于 2023-6-12 22:53
不用连续撒,一直连接他的下一篇,图片估计搞不了,就有自己配图

千万级别文章 估计很容易采集中断
一针见血   
wkcm 发表于 2023-6-12 22:56
这是内部员工搞的,百度从骨子里烂透了,就这垃圾站,连个分页都没有,哪里符合好网站的标准?

头条 百家号的文章 至少算伪原创 比ai生成的那种好太多
您需要登录后才可以回帖 登录 | 立即注册

返回顶部