爬虫日记(88)：Scrapy的Downloader类

Posted 2021-07-06 caimouse

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了爬虫日记(88)：Scrapy的Downloader类相关的知识，希望对你有一定的参考价值。

从前面的分析我们知道，当下载的连接URL去重之后，就需要把URL放到下载器里进行下载，这样才会得到网页相关的数据，比如html、图片、脚本等等。然后我们根据网页再来抽取相关的数据，或者获得图片。接着下来，我们更进一步地来了解下载器是怎么样把URL的内容获取回来，明白整个数据取得的过程，对于我们了解爬虫过程也是有重要意义的。

从下图就可以了解整个下载器的初始化过程：

先从引擎的构造函数里进行初始化，它是从缺省的配置文件里加载参数DOWNLOADER，而这个参数里保存的是scrapy.core.downloader.Downloader，也就是下面的包目录：

以上是关于爬虫日记(88)：Scrapy的Downloader类的主要内容，如果未能解决你的问题，请参考以下文章