python爬虫之趟雷
Posted snow-lanuage
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python爬虫之趟雷相关的知识,希望对你有一定的参考价值。
python爬虫之趟雷整理
雷一:URLError
问题具体描述:urllib.error.URLError: <urlopen error [Errno 11004] getaddrinfo failed
1 import urllib.request 2 3 4 def load_message(): 5 url = ‘http://www.baidu.com‘ 6 7 request = urllib.request.Request(url) 8 response = urllib.request.urlopen(request) 9 response_str = response.read().decode(‘utf-8‘) 10 11 return response.headers, request.headers, response_str 12 13 14 response_header, request_header, response_data = load_message() 15 print(request_header) 16 print(‘----------------------------------------‘) 17 print(response_header) 18 print(‘----------------------------------------‘) 19 print(response_data)
分析:报错原因为URLError,产生原因为URL,简单来说,就是URL资源无法访问或者访问不了。具体问题出在三个方向,URL本身,客户端,服务器。
解决办法:第一点,检查URL书写是否正确;第二点,检查客户端网络连接状态;第三点,使用URL在浏览器地址栏访问验证服务器是否存在。
以上是关于python爬虫之趟雷的主要内容,如果未能解决你的问题,请参考以下文章
Python练习册 第 0013 题: 用 Python 写一个爬图片的程序,爬 这个链接里的日本妹子图片 :-),(http://tieba.baidu.com/p/2166231880)(代码片段