有没有采集高手 解决一个采集问题

查看 25|回复 0
作者:ChinaDoiphin   

网址: manwadc.cc/chapter/30782166 (只需要要这个 chapter 页的里面的图片地址)
费用: 50U
问题: 这个网站我不管是用Puppeteer Selenium 还是 Get 请求 都会出现一个问题  采集被封禁 403 (能访问但是会少图片) 然后
class="img-content" 里面就变成只剩 2 张 或者是 图片乱序  封禁规则应该是按 IP
使用代理 IP 降低速率 采集一段时间 都会出现这个问题
需求: 稳定采集不触发 能正常长时间采集 (需要一个 Api 返回图片列表 然后稳定采集列表是对的 顺序对的 不漏图片)
能解决的私信我  获取很简单  就是目前这个采集一会就会出现只有 2 张图片的情况  一般采集个 5-6 本就出现了 间隔 10s左右 跑一天左右还是会出现

图片, 都会, 就会

您需要登录后才可以回帖 登录 | 立即注册

返回顶部