转:urllib.request.urlopen字符编码报错

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了转:urllib.request.urlopen字符编码报错相关的知识,希望对你有一定的参考价值。

错误内容:UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 28-29: ordinal not in range(128)

1.以为是代码错误,检查tab符,并没有问题,

2.将代码粘贴到空白项目中去,发现还是不对。

3.百度:http://blog.csdn.net/olanlanxiari/article/details/48201231

  1.Python在安装时,默认的编码是ascii,当程序中出现非ascii编码时,python的处理常常会报这样的错UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 0x?? in position 1: ordinal not in range(128),python没办法处理非ascii编码的,此时需要自己设置将python的默认编码,一般设置为utf8的编码格式。

  2.将上面问题自身检查,我这不存在这种问题,所以继续百度

  3.发现python3 urlopen()链接地址不能出现中文,,那么有中文怎么办?

    a.办法总是有的:替换

    b.将中文内容通过quote方法替换

       from urllib.parse import quote

       quote(url)

       quote(url,safe=‘/:?=‘)  

    c.quote可用的参数如下:

      quote(string,safe=‘/‘,encoding=None,errors=None)

      reserved = ";" | "/" | "?" | ":" | "@" | "&" | "=" | "+" | "$" | ","

以上是关于转:urllib.request.urlopen字符编码报错的主要内容,如果未能解决你的问题,请参考以下文章

Python 3.X 要使用urllib.request 来抓取网络资源。转

Python 3.X 要使用urllib.request 来抓取网络资源。转

[Python系列-19]:爬虫 - urllib.request.urlopen()和urllib.request.get()的使用区别

urllib.request 模块-urlopen方法

Python urllib.request.urlopen() 返回错误 403

带有身份验证的 urllib.request.urlopen(url)