scrapy框架介绍

Posted weilantian

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了scrapy框架介绍相关的知识,希望对你有一定的参考价值。

简介

 

Scrapy一个开源和协作的框架,其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的,使用它可以以快速、简单、可扩展的方式从网站中提取所需的数据。但目前Scrapy的用途十分广泛,可用于如数据挖掘、监测和自动化测试等领域,也可以应用在获取API所返回的数据(例如 Amazon Associates Web Services ) 或者通用的网络爬虫。     Scrapy 是基于twisted框架开发而来,twisted是一个流行的事件驱动的python网络框架。因此Scrapy使用了一种非阻塞(又名异步)的代码来实现并发。整体架构大致如下

技术图片

 

 

 

引擎(EGINE)

  引擎负责控制系统所有组件之间的数据流,并在某些动作发生时触发事件。有关详细信息,请参见上面的数据流部分。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

以上是关于scrapy框架介绍的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫教程-30-Scrapy 爬虫框架介绍

Python爬虫基础--Scrapy框架的安装及介绍

scrapy框架介绍

爬虫之scrapy框架

玩转 Scrapy 框架 :Scrapy 架构Request和Response介绍

玩转 Scrapy 框架 :Scrapy 架构Request和Response介绍