selenium+PhantomJS简单爬虫
Posted @SkySea
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了selenium+PhantomJS简单爬虫相关的知识,希望对你有一定的参考价值。
#!/usr/bin/env python # -*- coding: utf-8 -*- ‘‘‘ Created on 2017年10月19日 @author: zzy ‘‘‘ import time from selenium import webdriver from selenium.common import exceptions #注意:Python文件名或者包名不要命名为selenium,会导致无法导入 def main(): #browser = webdriver.Ie(executable_path=‘C:\geckodriver\geckodriver.exe‘) browser = webdriver.PhantomJS(executable_path=‘C:\geckodriver\phantomjs.exe‘) try: browser.get(r‘https://qian.qq.com/index.shtml?stat_data=oum62ppcsy004&ADTAG=SCQD.PINZ.PC.CZZ1‘) #time.sleep(5) html = browser.find_element_by_css_selector(‘.banner‘).get_attribute(‘innerHTML‘) print(html) except exceptions.TimeoutException as ex: print(ex) if __name__ == ‘__main__‘: main()
版本说明:
py3.6
selenium3.6
geckodriver-v0.19.0-win64
phantomjs-2.1.1-windows
以上是关于selenium+PhantomJS简单爬虫的主要内容,如果未能解决你的问题,请参考以下文章
[Python爬虫] 之二十六:Selenium +phantomjs 利用 pyquery抓取智能电视网站图片信息
[转]爬虫 selenium + phantomjs / chrome