字符编码详解

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了字符编码详解相关的知识,希望对你有一定的参考价值。

1.acsii表,00000000,8位存储,一共有256个种表示方法,使用英语的国家使用一张acsii表即可

  a,美国人使用只需要128种表示方法即可表示所有字符

  b,拉丁国家使用了256种表示方法

2.GB2312,中国人使用,需要两个字节,刚开始只能表示几千个汉字

  GBK,能表示所有汉字,2万多种

3.unicode  两个字节能表示6万多种种状态,俗称万国码,能够表示所有国家的明文

4.utf-8  中文默认使用三个字节,英文一个字节,结合unicode,ascii码衍生出来的一种编码

5.python解释器:

  python解释器是一个对其它编码进行编码,解码,并且执行文件的一个工具

  对代码进行逐行解释逐行执行

python 2.X默认使用unicode码对py文件进行解码,但是解释代码中的字符时,默认使用的是ascii码

  a.str:bytes

  b:uncide:unicode 

技术分享

 

python 3.X默认使用unicode对py文件进行解码,对代码中的字符解码默认使用的是unicode

   3.X里面严格区分byte跟unicode两种类型

  str:unicode

  bytes:bytes

 

   

以上是关于字符编码详解的主要内容,如果未能解决你的问题,请参考以下文章

字符集与字符编码详解

Python2.7字符编码详解

字符编码详解——彻底理解掌握编码知识,“乱码”不复存在

Base64编码详解

Windows核心编程字符编码详解

Python之Win字符编码详解