python2与python3 字符问题以及 字符编码 内容总结

Posted liu--huan

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python2与python3 字符问题以及 字符编码 内容总结相关的知识,希望对你有一定的参考价值。

python2与python3默认编码:

   python2:gbk                   print( u‘上‘ )     操作系统也是 gbk

     python3:unicode     print( ‘上’ )    

 

字符编码转换关系:

  unicode --》encode (编码)--》gbk  其他形式的二进制               write

  gbk  其他形式的二进制 --》decode (解码)--》unicode               read

 

各种编码格式与字节对应关系:

  bytes ; 字节

  ASCIL: 英文1个bytes,中文没有对应关系    ( 65-90:A-Z      97-122)    

  gbk ;  中文2个bytes,英文1个bytes

  unicode ;  中英文2个bytes

  utf-8: 中文3个bytes,英文一个bytes

  

文件头

  coding : utf-8

  x = ‘上‘     文件头指定的 utf-8 就是 utf-8 的二进制 

 

 

  

 

 

 

  

 

以上是关于python2与python3 字符问题以及 字符编码 内容总结的主要内容,如果未能解决你的问题,请参考以下文章

输入输出格式化字符串以及运算符

Python2 与 Python3 的编码对比

python2.x与python3.x的区别

Python2与python3中字符串的区别

python2x 与 python3x 区别

自定义验证规则以及中间件简单介绍