转:urllib.request.urlopen字符编码报错
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了转:urllib.request.urlopen字符编码报错相关的知识,希望对你有一定的参考价值。
错误内容:UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 28-29: ordinal not in range(128)
1.以为是代码错误,检查tab符,并没有问题,
2.将代码粘贴到空白项目中去,发现还是不对。
3.百度:http://blog.csdn.net/olanlanxiari/article/details/48201231
1.Python在安装时,默认的编码是ascii,当程序中出现非ascii编码时,python的处理常常会报这样的错UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 0x?? in position 1: ordinal not in range(128),python没办法处理非ascii编码的,此时需要自己设置将python的默认编码,一般设置为utf8的编码格式。
2.将上面问题自身检查,我这不存在这种问题,所以继续百度
3.发现python3 urlopen()链接地址不能出现中文,,那么有中文怎么办?
a.办法总是有的:替换
b.将中文内容通过quote方法替换
from urllib.parse import quote
quote(url)
quote(url,safe=‘/:?=
‘)
c.quote可用的参数如下:
quote(string,safe=‘/‘,encoding=None,errors=None)
reserved = ";" | "/" | "?" | ":" | "@" | "&" | "=" | "+" | "$" | ","
以上是关于转:urllib.request.urlopen字符编码报错的主要内容,如果未能解决你的问题,请参考以下文章
Python 3.X 要使用urllib.request 来抓取网络资源。转
Python 3.X 要使用urllib.request 来抓取网络资源。转
[Python系列-19]:爬虫 - urllib.request.urlopen()和urllib.request.get()的使用区别