scarpy-redis运行爬虫后,redis数据里只有dupefilter,而没有requests

Posted lb809663396

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了scarpy-redis运行爬虫后,redis数据里只有dupefilter,而没有requests相关的知识,希望对你有一定的参考价值。

scarpy-redis运行爬虫后

在redis中并没有保存requests,只保存了dupefilter,ctrl+c停止后,才会在redis中保存requests

原因是因为 生成next_url太慢,即往redis push之后,立马被pop了,才导致redis 没有 requests的序列化,然后导致其他scrapy实例无法读取request继而无法同时进行数据抓取

解决:生成next_url的时候快点,从列表展示页抓,生成比较快

 

以上是关于scarpy-redis运行爬虫后,redis数据里只有dupefilter,而没有requests的主要内容,如果未能解决你的问题,请参考以下文章

解决 Scrapy-Redis 空跑问题,链接跑完后自动关闭爬虫

爬虫文件存储-3:Redis

爬虫实战国家企业公示网-crawler爬虫抓取数据

玩爬虫封IP是最头痛的事情!从零搭建异步爬虫代理池!随你怎么封

爬虫相关

scrapy-redis怎么使用