02 scrapy 入门
Posted zhangjian0092
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了02 scrapy 入门相关的知识,希望对你有一定的参考价值。
1. 创建项目
- 创建项目
- scrapy startproject tutorial
- 创建spider
- cd tutorial
- scrapy genspider quotes quotes.toscrape.com
- 创建item
- class QuoteItem(scrapy.Item):
- text = scrapy.Field()
- class QuoteItem(scrapy.Item):
- 解析response
- 在parse函数中解析response
- response.xpath( ‘//xpath表达式‘ ).extract_first()
- 使用item
- 声明的时候需要先实例化, 然后依次用刚才解析的结果赋值item的每一个字段, 最后将item返回即可 yield item
- 后续request
- yield scrapy.Request(url=url, callback=self.parse)
- 运行:
- scrapy crawl quotes
- scrapy crawl quotes -o quotes.json / 保存到指定文件 txt csv json
以上是关于02 scrapy 入门的主要内容,如果未能解决你的问题,请参考以下文章