scrapy 的 item 队列把内存挤爆

查看 7|回复 0
作者:bwijn   
scrapy 的 spider 抓取了很多 item 然后交给 pipeline,
但是 pipeline 处理的太慢了,我的业务很耗时,但是 spider 还在不停抓取,导致任务积压
我目前打算使用 arq(异步消息框架)
spider 抓到的 item 直接扔给 arq,扔之前查看任务队列是否过多,可以暂停发布任务
各位有好的想法吗
您需要登录后才可以回帖 登录 | 立即注册

返回顶部