爬虫日记(69)：Scrapy的CrawlSpider使用

Posted 2021-05-19 caimouse

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了爬虫日记(69)：Scrapy的CrawlSpider使用相关的知识，希望对你有一定的参考价值。

在开发爬虫的过程中，经常会遇到非常规则的网站，只需要一条或几条规则就可以把整个网站的内容收集到了。对于这样的网站，我们就可以采用更加简单的方法，就是采用CrawlSpider类作为基类的蜘蛛类，它可以从首页里指定一些规则，然后就可以收集到下一个连接的地址。

在前面的文章：

里已经介绍过这个类的基本内容，如果你记不起了，可以再回头去查看一下。接着下来，我们来演示一下如何爬取一个RSS的网站：

因为很多人要学习英语，就需要查看一些文章，因此需要开发一个手机的应用，把这些文章推送给学习的用户，这样每个月就可以从用户那里收取几元的月租费。如果把这个收集文章的任务自动化，就需要使用爬虫的工作了。因此学习这个爬虫还是很有实用价值的。

以上是关于爬虫日记(69)：Scrapy的CrawlSpider使用的主要内容，如果未能解决你的问题，请参考以下文章