python2与python3 字符问题以及 字符编码 内容总结
Posted liu--huan
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python2与python3 字符问题以及 字符编码 内容总结相关的知识,希望对你有一定的参考价值。
python2与python3默认编码:
python2:gbk print( u‘上‘ ) 操作系统也是 gbk
python3:unicode print( ‘上’ )
字符编码转换关系:
unicode --》encode (编码)--》gbk 其他形式的二进制 write
gbk 其他形式的二进制 --》decode (解码)--》unicode read
各种编码格式与字节对应关系:
bytes ; 字节
ASCIL: 英文1个bytes,中文没有对应关系 ( 65-90:A-Z 97-122)
gbk ; 中文2个bytes,英文1个bytes
unicode ; 中英文2个bytes
utf-8: 中文3个bytes,英文一个bytes
文件头
coding : utf-8
x = ‘上‘ 文件头指定的 utf-8 就是 utf-8 的二进制
以上是关于python2与python3 字符问题以及 字符编码 内容总结的主要内容,如果未能解决你的问题,请参考以下文章