爬虫24-scrapy框架部署

Posted wcymiracle

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬虫24-scrapy框架部署相关的知识,希望对你有一定的参考价值。

1.安装scrapy框架:pip install scrapy

2.使用cmd窗口命令创建项目:

①进入要创建项目的路径

②scrapy startproject qsbk(项目名)

③pycharm下打开刚才创建的项目

④修改settings下的ROBOTSTXT_OBEY=False

⑤再添加下面DEFAULT_REQUEST_HEADERS添加headers信息

⑥指定项目名文件下的start_url信息,改成要爬取的网页

⑦项目名下添加start文件,就是执行代码的主文件,如下:

from scrapy import cmdline
cmdline.execute("scrapy crawl qsbk_spider".split())

  

⑧在QsbkSpiderSpider类中实现要爬取的功能

以上是关于爬虫24-scrapy框架部署的主要内容,如果未能解决你的问题,请参考以下文章

scrapy按顺序启动多个爬虫代码片段(python3)

scrapy主动退出爬虫的代码片段(python3)

(Scrapy框架)爬虫获取百度新冠疫情数据 | 爬虫案例

Python 和 Scrapy 爬虫框架部署

快速部署网络爬虫框架scrapy

分布式部署爬虫项目