python爬虫使用requests请求无法获取网页元素时终极解决方案

Posted 坚持是一种习惯

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python爬虫使用requests请求无法获取网页元素时终极解决方案相关的知识,希望对你有一定的参考价值。

    爬取数据时,有时候会出现无法通过正常的requests请求获取网页内容,导致数据无法抓取到,遇到这种情况时,可以换种思路去爬取数据,使用PhantomJS,即爬虫终极解决方案去获取页面元素。

 

#!/usr/local/bin/python3.7

from selenium import webdriver
import time

# phantomJS路径
path = /Users/mozili/Documents/PhantomJS/phantomjs-2.1.1-macosx/bin/phantomjs
# 创建浏览器对象
browser = webdriver.PhantomJS(path)

# 打开百度并操作
url = https://www.baidu.com
browser.get(url)
time.sleep(1)
# 截图
browser.save_screenshot(Reptile/phantomjs_img/baidu.png)
# 定位搜索框
search = browser.find_element_by_id(kw)
time.sleep(1)
# 在搜索框输入内容
search.send_keys(美女)
time.sleep(1)
# 截图
browser.save_screenshot(Reptile/phantomjs_img/meinv.png)
# 关闭浏览器
browser.quit()

 

以上是关于python爬虫使用requests请求无法获取网页元素时终极解决方案的主要内容,如果未能解决你的问题,请参考以下文章

python爬虫实战一|大众点评网

Python爬虫从入门到进阶之requests的使用

python爬虫入门练习,使用正则表达式和requests爬取LOL官网皮肤

python爬虫获取中国天气网天气数据 requests BeautifulSoup re

1python爬虫 request.urlopen请求网页获取源码

python 爬虫 简单爬虫教程(requests + selenium )