scrapy基本介绍

Posted huahuawang

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了scrapy基本介绍相关的知识,希望对你有一定的参考价值。

scrapy初识

  • 什么是框架?
    • 所谓的框架简单通用解释就是就是一个具有很强通用性并且集成了很多功能的项目模板,该模板可被应用在不同的项目需求中。也可被视为是一个项目的半成品。
  • 如何学习框架?
    • 对于刚接触编程或者初级程序员来讲,对于一个新的框架,只需要掌握该框架的作用及其各个功能的使用和应用即可,对于框架的底层实现和原理,在逐步进阶的过程中在慢慢深入即可。
  • 什么是scrapy?
    • Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,非常出名,非常强悍。其内部已经被集成了各种功能(高性能异步下载,队列,分布式,解析,持久化等)。对于框架的学习,重点是要学习其框架的特性、各个功能的用法即可。

scrapy基本使用

    • 环境安装:
      • linux和mac操作系统:
        • pip install scrapy
      • windows系统:
        • pip install wheel
        • 下载twisted,下载地址为http://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted
        • 安装twisted:pip install Twisted?17.1.0?cp36?cp36m?win_amd64.whl
        • pip install pywin32
        • pip install scrapy
          测试:在终端里录入scrapy指令,没有报错即表示安装成功!
    • scrapy使用流程:
      • 创建工程:
        • scrapy startproject ProName
      • 进入工程目录:
        • cd ProName
      • 创建爬虫文件:
        • scrapy genspider spiderName www.xxx.com
      • 编写相关操作代码
      • 执行工程:
        • scrapy crawl spiderName

以上是关于scrapy基本介绍的主要内容,如果未能解决你的问题,请参考以下文章

Python网络爬虫实战-Scrapy视频教程 Python系统化项目实战课程 Scrapy技术课程

python爬虫之Scrapy框架,基本介绍使用以及用框架下载图片案例

python爬虫之Scrapy框架,基本介绍使用以及用框架下载图片案例

浅析Scrapy框架运行的基本流程

Python | 初识爬虫框架Scrapy

从零开始写Python爬虫 --- 2.1 Scrapy 爬虫框架的安装与基本介绍