scrapy爬虫框架

Posted Braveliberty

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了scrapy爬虫框架相关的知识,希望对你有一定的参考价值。

downloader:负责下载html页面

spider:负责爬取页面内容,我们需要自己写爬取规则  srapy提供了selector,获取的方式有xpath,css,正则,extract 

item容器:spider获取到的内容放到item中

schedul:负责调度    

以上是关于scrapy爬虫框架的主要内容,如果未能解决你的问题,请参考以下文章

Python 爬虫-Scrapy爬虫框架

Python爬虫教程-30-Scrapy 爬虫框架介绍

Python爬虫 ---scrapy框架初探及实战

爬虫2.1-scrapy框架-两种爬虫对比

Scrapy爬虫框架

Python爬虫教程-31-创建 Scrapy 爬虫框架项目