爬虫日记(89):Scrapy的DownloadHandlers类

Posted caimouse

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬虫日记(89):Scrapy的DownloadHandlers类相关的知识,希望对你有一定的参考价值。

前面分析了下载器的整个源码,理解了下载器的工作过程,在那里经常会遇到一个类,就是DownloadHandlers类,这个类主要用来对不同的下载协议进行管理的,比如文件协议和http协议不一样,那么就需要使用不同的类来表示,又比如https的下载和http的下载过程也不一样,这样也要分开处理。因此DownloadHandlers类需要实现不同的协议、不同的下载方式进行管理。

我们先来看一下默认的设置参数:

DOWNLOAD_HANDLERS_BASE = {

    \'data\': \'scrapy.core.downloader.handlers.datauri.DataURIDownloadHandler\',

    \'file\': \'scrapy.core.downloader.handlers.file.FileDownloadHandler\',

    \'http\': \'scrapy.core.downloa

以上是关于爬虫日记(89):Scrapy的DownloadHandlers类的主要内容,如果未能解决你的问题,请参考以下文章

爬虫日记(63):Scrapy的设置参数-日志

爬虫日记(73):Scrapy程序运行入口点分析

爬虫日记(75):Scrapy的Settings源码分析

爬虫日记(74):Scrapy项目配置参数源码分析(二)

爬虫日记(76):Scrapy的命令行源码分析二

爬虫日记(85):Scrapy的ExecutionEngine类