python爬虫之趟雷

Posted snow-lanuage

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python爬虫之趟雷相关的知识,希望对你有一定的参考价值。

python爬虫之趟雷整理

雷一:URLError

  问题具体描述:urllib.error.URLError: <urlopen error [Errno 11004] getaddrinfo failed

技术图片
 1 import urllib.request
 2 
 3 
 4 def load_message():
 5     url = http://www.baidu.com
 6 
 7     request = urllib.request.Request(url)
 8     response = urllib.request.urlopen(request)
 9     response_str = response.read().decode(utf-8)
10 
11     return response.headers, request.headers, response_str
12 
13 
14 response_header, request_header, response_data = load_message()
15 print(request_header)
16 print(----------------------------------------)
17 print(response_header)
18 print(----------------------------------------)
19 print(response_data)
View Code

  分析:报错原因为URLError,产生原因为URL,简单来说,就是URL资源无法访问或者访问不了。具体问题出在三个方向,URL本身,客户端,服务器。

  解决办法:第一点,检查URL书写是否正确;第二点,检查客户端网络连接状态;第三点,使用URL在浏览器地址栏访问验证服务器是否存在。

以上是关于python爬虫之趟雷的主要内容,如果未能解决你的问题,请参考以下文章

scrapy主动退出爬虫的代码片段(python3)

Python练习册 第 0013 题: 用 Python 写一个爬图片的程序,爬 这个链接里的日本妹子图片 :-),(http://tieba.baidu.com/p/2166231880)(代码片段

python爬虫学习笔记-M3U8流视频数据爬虫

爬虫遇到头疼的验证码?Python实战讲解弹窗处理和验证码识别

python网络爬虫

Python 利用爬虫爬取网页内容 (div节点的疑惑)