Crawlspider
Posted jnhnsnow
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Crawlspider相关的知识,希望对你有一定的参考价值。
Spider的一个子类,用于全站数据爬取
全站爬取:
1.基于Spider:手动请求发送
2.基于Crawlspider:
cralwspider使用:
创建工程
cdxxx
创建爬虫文件(crawlspider):scrapy genspider -t crawl xxx www.xxx.com
链接提取器:提取链接 根据指定规则(allow="正则")进行指定链接的提取
规则解析器:
以上是关于Crawlspider的主要内容,如果未能解决你的问题,请参考以下文章