redis-scrapy分布式系统搭建

Posted qianzeng

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了redis-scrapy分布式系统搭建相关的知识,希望对你有一定的参考价值。

下载

  • Reids:https://github.com/MicrosoftArchive/redis
  • scrapy-redis:https://github.com/rmax/scrapy-redis
  • redis-py:> pip install redis
  • python:3.5

 

将下面设置添加到setting.py

1 SCHEDULER = "scrapy_redis.scheduler.Scheduler"
2 DUPEFILTER_CLASS = "scrapy_redis.dupefilter.RFPDupeFilter"
3 TEM_PIPELINES = {
4   \'scrapy_redis.pipelines.RedisPipeline\': 300
5 }

 

启动

  1. 在spider.py上设置 name 和 redis_key
  2. 启动redis-server、redis-cli 和 pycharm,可以看到scapy在等待start_urls
    1 2018-02-26 14:07:56 [scrapy.extensions.telnet] DEBUG: Telnet console listening on 127.0.0.1:6023
  3. 在redis-cli上输入 llpush [redis_key] [start_urls] 启动爬虫

 



salver机上的配置与master无异,主从连接参考http://www.cnblogs.com/kylinlin/p/5198233.html

以上是关于redis-scrapy分布式系统搭建的主要内容,如果未能解决你的问题,请参考以下文章

Redis-Scrapy的example

Net分布式系统之二:CentOS系统搭建Nginx负载均衡

dubbo分布式系统---环境搭建

如何利用redis来进行分布式集群系统的限流设计

如何在分布式环境中搭建单点登录系统| 第二篇:基于Oauth2.0开发SSO核心代码

搭建简单的分布式系统