搭建Scrapy爬虫框架

Posted 智趣智学

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了搭建Scrapy爬虫框架相关的知识,希望对你有一定的参考价值。

搭建Scrapy爬虫框架


对于python2.X版本:

第一步安装python

第二步安装pywin32(https://sourceforge.net/projects/pywin32/files/pywin32/根据系统位数下载相应版本)

第三步安装python并并配置环境变量,配置方法如下
右键我的电脑—属相—高级系统设置—环境变量—选中用户变量path—点击编辑—点击新建—将python.exe的安装目录粘贴进去—确定

第四步下载并解压easy_install,然后cmd命令进入解压的目录后运行python setup.py install

当出现Finished processing dependencies forez-setup==0.9则表明安装成功

另外在cmd窗口中执行命令pip –version若显示版本号,则表明安装成功

第五步安装lxml

安装lxml的命令是:pipinstall lxml

第六安装pyOpenSSL

pip install pyOpenSSL

第七安装scrapy

Pip install scrapy

 

对于python3X版本:

第一安装twisted模块

打开网站https://www.lfd.uci.edu/~gohlke/pythonlibs/按下ctrl+F搜索twisted

因为我的系统是64位的并且我的python版本是3.7,所以我下载twain-1.0.4-cp37-cp37m-win_amd64.whl

Cmd窗口执行pip installtwain-1.0.4-cp37-cp37m-win_amd64.whl

第二安装Scrapy框架即cmd窗口执行pip install Scrapy(安装Scrapy同时会自动安装lxml和pyOpenSSL)

第三创建Scrapy项目:

在要创建项目的文件夹下执行cmd窗口,运行命令scrapystartproject scrapyDemo便可以得到一个目录组

备注:

如果在执行Scrapy项目创建的时候,出现以下报错:error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools说明第一步中下载的twain版本不对,解决的办法就是需要重新下载twain进行安装后,再执行一遍Scrapy安装即可解决

以上是关于搭建Scrapy爬虫框架的主要内容,如果未能解决你的问题,请参考以下文章

怎么在32位windows系统上搭建爬虫框架scrapy?

Python | 初识爬虫框架Scrapy

Scrapy爬虫框架入门

爬虫--Scrapy框架的基本使用

Scrapy框架--分布式爬虫

Python | 边学边敲边记第四次:初识爬虫框架Scrapy