Python爬虫学习——使用selenium和phantomjs爬取js动态加载的网页
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫学习——使用selenium和phantomjs爬取js动态加载的网页相关的知识,希望对你有一定的参考价值。
1.安装selenium
pip install selenium Collecting selenium Downloading selenium-3.4.1-py2.py3-none-any.whl (931kB) 100% |████████████████████████████████| 942kB 573kB/s Installing collected packages: selenium Successfully installed selenium-3.4.1
2.安装phantomjs
下载地址:http://phantomjs.org/download.html
下载的版本是:phantomjs-2.1.1-linux-x86_64.tar.bz2
解压下载好的文件,并把文件夹移动到/usr/local目录下
sudo mv phantomjs-2.1.1-linux-x86_64 /usr/local/phantomjs
在/etc/profile下添加,之后source /etc/profile
export PHANTOMJS_HOME=/usr/local/phantomjs export PATH=$PATH:$PHANTOMJS_HOME/bin
测试是否安装成功
phantomjs -v 2.1.1
以上是关于Python爬虫学习——使用selenium和phantomjs爬取js动态加载的网页的主要内容,如果未能解决你的问题,请参考以下文章
爬虫学习 08.Python网络爬虫之图片懒加载技术selenium和PhantomJS
[python爬虫] Selenium常见元素定位方法和操作的学习介绍