selenium+PhantomJS简单爬虫

Posted @SkySea

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了selenium+PhantomJS简单爬虫相关的知识,希望对你有一定的参考价值。

#!/usr/bin/env python
# -*- coding: utf-8 -*-
‘‘‘
Created on 2017年10月19日
@author: zzy
‘‘‘
import time
from selenium import webdriver
from selenium.common import exceptions

#注意:Python文件名或者包名不要命名为selenium,会导致无法导入

def main():
    #browser = webdriver.Ie(executable_path=‘C:\geckodriver\geckodriver.exe‘)
    browser = webdriver.PhantomJS(executable_path=C:\geckodriver\phantomjs.exe)
    try:
        browser.get(rhttps://qian.qq.com/index.shtml?stat_data=oum62ppcsy004&ADTAG=SCQD.PINZ.PC.CZZ1)
        #time.sleep(5)
        html = browser.find_element_by_css_selector(.banner).get_attribute(innerHTML)
        print(html)
    except exceptions.TimeoutException as ex:
        print(ex)

if __name__ == __main__:
    main()

 版本说明:

py3.6

selenium3.6

geckodriver-v0.19.0-win64

phantomjs-2.1.1-windows

以上是关于selenium+PhantomJS简单爬虫的主要内容,如果未能解决你的问题,请参考以下文章

[Python爬虫] 之二十六:Selenium +phantomjs 利用 pyquery抓取智能电视网站图片信息

[转]爬虫 selenium + phantomjs / chrome

爬虫大杀器——phantomJS+selenium

Python爬虫教程-26-Selenium + PhantomJS

Python爬虫_Selenium与PhantomJS

Python爬虫(二十一)_Selenium与PhantomJS