Scrapy爬虫框架

Posted sss4

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Scrapy爬虫框架相关的知识,希望对你有一定的参考价值。

前言:

自己利用requests模块下载页面,使用Beautifulsoup解析html内容,久而久之会遇到各种性能问题,所有专业级的爬虫还得使用 爬虫框架----Scrapy

 

Scrapy功能

----引用twisted模块异步下载页面

-----HTML解析成对象

-----代理

----延迟下载

----URL字段去重

----指定深度、广度

...........................

 技术分享图片

 

 

 

 

 

 

 

 

 

 

 

 

参考:http://www.cnblogs.com/wupeiqi/articles/6229292.html

以上是关于Scrapy爬虫框架的主要内容,如果未能解决你的问题,请参考以下文章

Python 爬虫-Scrapy爬虫框架

Python爬虫教程-30-Scrapy 爬虫框架介绍

Python爬虫 ---scrapy框架初探及实战

爬虫2.1-scrapy框架-两种爬虫对比

Scrapy爬虫框架

Python爬虫教程-31-创建 Scrapy 爬虫框架项目