Python编码简要说明

Posted 山的那一边

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python编码简要说明相关的知识,希望对你有一定的参考价值。

●python2默认编码:ASCII编码
达到正确显示,程序需要编码转换:
UTF-8 -- >decode解码 --> Unicode
Unicode -- > encode编码 -- > GBK / UTF-8
●python3默认文件编码:utf-8(解释器编码)
python3的内存里:全部是unicode
python3执行代码的过程:
1、解释器找到代码文件,把代码字符串按文件头定义的编码加载到内存,转成unicode
2、把代码字符串按照python语法规则进行解释
3、所有的变量字符都会以unicode编码声明
※windows的默认编码是gbk。
●python2
  文件编码默认:ascii
  字符串编码默认:ascii
  如果文件头声明了utf-8,那字符串的编码是utf-8
●python3
  文件编码默认 :utf-8
  字符串编码:unicode
●文件头:
python2:以utf-8 or gbk 编码的代码,代码内容加载到内存,并不会被转成unicode,编码依然是utf-8 or gbk。
python3:以utf-8 or gbk编码的代码,代码内容加到在内存,会被自动转成unicode。
●常见编码错误的原因有:
  1、python解释器的默认编码
  2、python源文件文件编码
  3、终端使用的编码(windows/linux/os)
  4、操作系统的语言设置
※unicode与gbk的映射表:http://www.unicode.org/charts/

以上是关于Python编码简要说明的主要内容,如果未能解决你的问题,请参考以下文章

关于python指定字符编码的说明

linux之系统编码,python编码,文件编码

python3中的编码问题

Python3.X-文本编码问题

刚学python,抓中文网页遇到编码的问题,怎么转换也不行

Python基础之 一 字符编码及转换