爬虫基础三

Posted -2016

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬虫基础三相关的知识,希望对你有一定的参考价值。

学习内容:

1.Selenium详解


 

1.Selenium:自动化测试工具,支持多种浏览器。爬虫中主要用来解决javascript渲染的问题

2.安装:pip3 install selenium

3.声明浏览器对象

from selenium import webdriver

browser = webdriver.Edge()

4.访问页面

browser.get(https://www.taobao.com)
print(browser.page_source)
browser.close()

5.查找元素

单个元素

input_first = browser.find_element_by_id(q)
print(input_first)
browser.close()

urllib3.exceptions.ProtocolError: (‘Connection aborted.‘, ConnectionResetError(10054, ‘远程主机强迫关闭了一个现有的连接。‘, None, 10054, None))

以上是关于爬虫基础三的主要内容,如果未能解决你的问题,请参考以下文章

爬虫基础:验证码的爬取和识别详解

爬虫遇到头疼的验证码?Python实战讲解弹窗处理和验证码识别

零基础深度学习爬虫验证码识别

C++项目三代码参考(改进版)

好课分享:零基础深度学习爬虫验证码识别百度云

好课分享: CTO 零基础深度学习爬虫验证码识别 百度云