python3无界面浏览PhantomJS的安装教程

Posted zhi_neng

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python3无界面浏览PhantomJS的安装教程相关的知识,希望对你有一定的参考价值。

PhantomJS 是一个无界面的、可脚本编程的 WebKit 浏览器引擎,它原生支持多种 Web 标准: DOM操作、CSS选择器、JSON、Canvas 以及SVG。Selenium 支持 PhantomJS,这样在运行的时候就不会再弹出一个浏览器了。而且PhantomJS 的运行效率也很高,还支持各种参数配置,使用非常方便。下面我们就来了解一下 PhantomJS 的安装过程。

1.相关链接

官方网站: http:/phantomjs.org

官方文档:http:/phantomjs.org/quick-start.html

下载地址:http://phantomjs.org/download.html

 API接口说明:http:/phantomjs.org/api/command-line.html

2.下载 PhantomJS

我们需要在官方网站下载对应的安装包,PhantomJS支持多种操作系统,比如 Windows、Linux、 Mac、FreeBSD等,我们可以选择对应的平台并将安装包下载下来。

PhantomJS下载页面

下载完成后,将 PhantomJS可执行文件所在的路径配置到环境变量里。比如在 Windows下,将下载的文件解压之后并打开,会看到一个 bin 文件夹,里面包括一个可执行文件 phantomjs.exe,我们需要将它直接放在配置好环境变量的路径下或者将它所在的路径配置到环境变量里。比如,我们既可以将它直接复制到 Python 的 Scripts 文件夹,也可以将它所在的 bin 目录加入到环境变量。

 

Windows下环境变量的配置、Linux及Mac环境变量的配置,在此不再赘述,关键在于将PhantomJS 的可执行文件所在路径配置到环境变量里。

配置成功后,可以在cmd命令行下测试一下,输人: phantomjs

如果可以进人到 PhantomJS 的命令行,那就证明配置完成了。

3.验证安装

在Selenium 中使用的话,我们只需要将 Chrome 切换为 PhantomJS 即可: 

from selenium import webdriver

browser = webdriver.PhantomJS()

browser.get('https://www.baidu.com') 

print(browser.current_url)

运行之后,我们就不会发现有浏览器弹出了,但实际上PhantomJS 已经运行起来了。这里我们访问了百度,然后将当前的URL打印出来。

控制台的输出如下:

https://www.baidu.com/

如此一来,我们便完成了PhantomJS 的配置,后面可以利用它来完成一些页面的抓取。

这里我们介绍了 Selenium对应的三大主流浏览器的对接方式,后面我们会对 Selenium 及各个浏览器的对接方法进行更加深入的探究。

 

以上是关于python3无界面浏览PhantomJS的安装教程的主要内容,如果未能解决你的问题,请参考以下文章

[Python3网络爬虫开发实战] 1.2.5-PhantomJS的安装

selenium phantomjs java无界面浏览器环境搭建

如何用python+selenium+phantomjs获得一个网页的动态生成的html代码

python+selenium+PhantomJS爬取网页动态加载内容

PhantomJS的安装和使用

芝麻HTTP:PhantomJS的安装