20171012 动态爬虫爬取预约挂号有号信息
Posted soar.pang
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了20171012 动态爬虫爬取预约挂号有号信息相关的知识,希望对你有一定的参考价值。
- -- 目标:针对医院有些医生有预约号不确定时间点有号,晚了就挂不到了,能有个监测爬去,有号就提醒的机制。
可能会用到:scrapy + PhantomJS + Selenium
环境: windows10 + vs 2015 + python 2.7
安装 : scrapy
创建项目: 命令提示符 界面 使用语句 scrapy startproject s_scrapy
成功后会提示创建的目录地址
cd s_scrapy
进入目录
tree /f
树形结构读取目录文件
在vs中创建一个python的项目,再增加现有文件s_scrapy到项目中,这样所有的项目文件都导入了,方便操作
下载PhantomJS ,Windows环境下载好后,解压得到PhantomJS.exe
放到cmd可以执行的路径下面,再通过cmd 执行语句phantomjs ./test.js http://baidu.com
当然了./test.js 路径要对,可以自己改
-- python 2.7 安装selenium 目的是为了调用PhantomJS 这种没有界面的浏览器,来实现交互功能
以上是关于20171012 动态爬虫爬取预约挂号有号信息的主要内容,如果未能解决你的问题,请参考以下文章