爬虫之Scrapy

Posted Mitsuis

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬虫之Scrapy相关的知识,希望对你有一定的参考价值。

一、scrapy安装配置

Linux
      pip3 install scrapy
 
 
Windows
      a. pip3 install wheel
      b. 下载twisted http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted
      c. 进入下载目录,执行 pip3 install Twisted?17.1.0?cp35?cp35m?win_amd64.whl
      d. pip3 install scrapy
      e. 下载并安装pywin32:https://sourceforge.net/projects/pywin32/files/

  

二、创建并运行scrapy

1. scrapy startproject 项目名称
   - 在当前目录中创建中创建一个项目文件(类似于Django)
 
2. scrapy genspider [-t template] <name> <domain>
   - 创建爬虫应用
   如:
      scrapy gensipider -t basic oldboy oldboy.com
      scrapy gensipider -t xmlfeed autohome autohome.com.cn
   PS:
      查看所有命令:scrapy gensipider -l
      查看模板命令:scrapy gensipider -d 模板名称
 
3. scrapy list
   - 展示爬虫应用列表
 
4. scrapy crawl 爬虫应用名称
   - 运行单独爬虫应用

  

以上是关于爬虫之Scrapy的主要内容,如果未能解决你的问题,请参考以下文章

Python之Scrapy安装

python爬虫scrapy之scrapy终端(Scrapy shell)

爬虫框架Scrapy 之 --- scrapy文件

走近代码之Python--爬虫框架Scrapy

Python编程基础之(五)Scrapy爬虫框架

Python爬虫之Scrapy框架结构