Python 爬取网页中JavaScript动态添加的内容
Posted 寒爵
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python 爬取网页中JavaScript动态添加的内容相关的知识,希望对你有一定的参考价值。
使用 selenium + phantomjs 实现
1、准备环境
selenium(一个用于web应用程测试的工具)安装:pip install selenium
phantomjs(是一种无界面的浏览器,用于完成网页的渲染)下载:http://phantomjs.org/download.html
2、使用
from selenium import webdriver url = ‘http://jandan.net/ooxx‘ driver = webdriver.PhantomJS( executable_path=‘D:/Software/phantomjs-2.1.1-windows/bin/phantomjs.exe‘) # phantomjs.exe所在的目录 driver.get(url) print(driver.page_source)
以上是关于Python 爬取网页中JavaScript动态添加的内容的主要内容,如果未能解决你的问题,请参考以下文章
python+selenium+PhantomJS爬取网页动态加载内容
Python网络爬虫_爬取Ajax动态加载和翻页时url不变的网页