Python 爬取网页中JavaScript动态添加的内容

Posted 寒爵

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python 爬取网页中JavaScript动态添加的内容相关的知识,希望对你有一定的参考价值。

使用 selenium + phantomjs 实现

1、准备环境

selenium(一个用于web应用程测试的工具)安装:pip install selenium
phantomjs(是一种无界面的浏览器,用于完成网页的渲染)下载:http://phantomjs.org/download.html

2、使用

from selenium import webdriver

url = http://jandan.net/ooxx
driver = webdriver.PhantomJS(
    executable_path=D:/Software/phantomjs-2.1.1-windows/bin/phantomjs.exe)  # phantomjs.exe所在的目录
driver.get(url)
print(driver.page_source)

 

以上是关于Python 爬取网页中JavaScript动态添加的内容的主要内容,如果未能解决你的问题,请参考以下文章

python+selenium+PhantomJS爬取网页动态加载内容

Python爬取js动态添加的内容

Python网络爬虫_爬取Ajax动态加载和翻页时url不变的网页

Python爬取动态生成的网页(框架)需要具备哪些知识或者使用哪些库?

python3 怎样爬取动态加载的网页信息

Python爬虫爬取动态网页