Scrapy改成Scrapy-Redis
Posted liubosong
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Scrapy改成Scrapy-Redis相关的知识,希望对你有一定的参考价值。
1. 增加去重容器类配置,
DUPEFILTER_CLASS = “scrapy_redis.dupefilter.RFPDupeFilter”
2. 增加调度配置,
SCHEDULER = “scrapy_redis.scheduler.Scheduler”
3. 配置调度器持久化, 爬虫结束, 要不要清空Redis中请求队列和去重指纹的set。如果True, 就表示要持久化存储, 否则清空数据
SCHEDULER_PERSIST = True
ITEM_PIPELINES = {
# 把爬虫爬取的数据存储到Redis数据库中
‘scrapy_redis.pipelines.RedisPipeline’: 400,
}
以上是关于Scrapy改成Scrapy-Redis的主要内容,如果未能解决你的问题,请参考以下文章
谁能帮我解答这个问题涉及到django,scrapy,celery