Python爬虫学习——使用selenium和phantomjs爬取js动态加载的网页

Posted 2020-09-15

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Python爬虫学习——使用selenium和phantomjs爬取js动态加载的网页相关的知识，希望对你有一定的参考价值。

1.安装selenium

pip install selenium
Collecting selenium
  Downloading selenium-3.4.1-py2.py3-none-any.whl (931kB)
    100% |████████████████████████████████| 942kB 573kB/s 
Installing collected packages: selenium
Successfully installed selenium-3.4.1

2.安装phantomjs

下载地址：http://phantomjs.org/download.html

下载的版本是：phantomjs-2.1.1-linux-x86_64.tar.bz2

解压下载好的文件，并把文件夹移动到/usr/local目录下

sudo mv phantomjs-2.1.1-linux-x86_64 /usr/local/phantomjs

在/etc/profile下添加，之后source /etc/profile

export PHANTOMJS_HOME=/usr/local/phantomjs
export PATH=$PATH:$PHANTOMJS_HOME/bin

测试是否安装成功

phantomjs -v
2.1.1

以上是关于Python爬虫学习——使用selenium和phantomjs爬取js动态加载的网页的主要内容，如果未能解决你的问题，请参考以下文章

Python爬虫学习：Selenium的使用

爬虫学习 08.Python网络爬虫之图片懒加载技术selenium和PhantomJS

[python爬虫] Selenium常见元素定位方法和操作的学习介绍

Rollo的Python之路Python 爬虫系统学习 Selenium

python爬虫　Selenium库学习

[Python爬虫] 在Windows下安装PIP+Phantomjs+Selenium