scrapy学习

Posted btxlc

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了scrapy学习相关的知识,希望对你有一定的参考价值。

 

 

 

 

技术图片 

安装依赖

技术图片

 

基础运用

技术图片

在item中定义一个类(scrapy.Item)来保存 类似于django

技术图片

 

yield返回两种东西,一种是在items中定义好的类 一种是新的请求

css选择器选取的标签

 

 

如果要保存到数据库 或者对数据进行一些处理 在pipeline中进行操作

处理可以返回两种值

技术图片

 

如果要存入数据库

技术图片

 

技术图片

 

 要记得修改pipeline设置

 技术图片

 

命令行命令

scrapy createproject projectName [dir]

开始新项目

 

scrapy genspider name url

创建爬虫

 

scrapy crawl name

执行对应爬虫命令 在class ClassName(scrapy.Spider)中定义类属性name

 

scrapy crawl [name] -o xxxx.json(.jl  .csv .pickle .marshal ftp://user:[email protected]/path/xxx.csv)

 

scrapy check 检查是否有错

scrapy list 查看所有爬虫

 

以上是关于scrapy学习的主要内容,如果未能解决你的问题,请参考以下文章

Scrapy基础一 ------学习Scrapy之前所要了解的

Scrapy框架学习笔记

Scrapy学习-

scrapy学习Scrapy入门

scrapy学习

scrapy学习--安装