02 scrapy 入门

Posted zhangjian0092

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了02 scrapy 入门相关的知识,希望对你有一定的参考价值。

1. 创建项目

  • 创建项目
    • scrapy startproject tutorial
  • 创建spider
    • cd tutorial
    • scrapy genspider quotes quotes.toscrape.com
  • 创建item
    • class QuoteItem(scrapy.Item):
      • text = scrapy.Field()
  • 解析response
    • 在parse函数中解析response
    • response.xpath( ‘//xpath表达式‘ ).extract_first()
  • 使用item
    • 声明的时候需要先实例化, 然后依次用刚才解析的结果赋值item的每一个字段, 最后将item返回即可 yield item
  • 后续request  
    • yield scrapy.Request(url=url, callback=self.parse)    
  • 运行:
    • scrapy crawl quotes
    • scrapy crawl quotes -o quotes.json  / 保存到指定文件   txt csv json                                        

以上是关于02 scrapy 入门的主要内容,如果未能解决你的问题,请参考以下文章

scrapy学习Scrapy入门

Scrapy 爬虫框架入门案例详解

scrapy入门:安装scrapy

scrapy入门到精通

scrapy安装及入门使用

Scrapy入门教程