python 编码问题

Posted shihaokiss

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 编码问题相关的知识,希望对你有一定的参考价值。

中文iso8859-1编码转utf8编码

str.encode("gbk").decode(‘gbk‘).encode(‘utf-8‘)

原理:

utf8编码的文本可以用iso8859-1的编码表示,但是反过来不行。iso8859-1是单字节编码,而utf8是定长编码,从utf8转化成iso8859-1相当于是高精度转化成低精度,造成精度丢失,所以不可逆。根本原因是因为utf8中文,在iso8859-1没有匹配的位置。

而gbk是不定长编码,英文数字的字符编码规则跟iso8859-1是一样的,所以gbk是兼容iso8859-1编码的,这两者可以相互转换。

以上是关于python 编码问题的主要内容,如果未能解决你的问题,请参考以下文章

python编码问题

python抓网页的编码问题

原创python中文编码问题深入分析:python2.7文件读写中文编码问题

python ACSII编码问题

python编码的问题

python 编码问题