python爬虫之趟雷

Posted 2021-02-08 snow-lanuage

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了python爬虫之趟雷相关的知识，希望对你有一定的参考价值。

python爬虫之趟雷整理

雷一：URLError

　　问题具体描述：urllib.error.URLError: <urlopen error [Errno 11004] getaddrinfo failed

 1 import urllib.request
 2 
 3 
 4 def load_message():
 5     url = ‘http://www.baidu.com‘
 6 
 7     request = urllib.request.Request(url)
 8     response = urllib.request.urlopen(request)
 9     response_str = response.read().decode(‘utf-8‘)
10 
11     return response.headers, request.headers, response_str
12 
13 
14 response_header, request_header, response_data = load_message()
15 print(request_header)
16 print(‘----------------------------------------‘)
17 print(response_header)
18 print(‘----------------------------------------‘)
19 print(response_data)

View Code

　　分析：报错原因为URLError，产生原因为URL，简单来说，就是URL资源无法访问或者访问不了。具体问题出在三个方向，URL本身，客户端，服务器。

　　解决办法：第一点，检查URL书写是否正确；第二点，检查客户端网络连接状态；第三点，使用URL在浏览器地址栏访问验证服务器是否存在。

以上是关于python爬虫之趟雷的主要内容，如果未能解决你的问题，请参考以下文章