Python学习----字符集编码

Posted tonytang271828

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python学习----字符集编码相关的知识,希望对你有一定的参考价值。

1 ASCII码: American Standard Code for information inerchange

   美国最初采用的二进制和字符的编码映射表

2 Gb2312, Gbk1.0, Gbk10830

   中国最开始制定的编码表Gb2312,只包含简体字,后发现繁体字没有加进去,不断扩充,而出现了Gbk系列编码

3 unicode, utf-8

   由于世界各国都制定本国的编码表,导致各国之间信息交流出现障碍,遂ISO组织出面制定全球统一的编码表,即unicode码,又称万国码。

   万国码虽然包括了世界各国所有的字符,但是每个字符都用两个字节表示,对于英语国家来说,造成了大量的空间浪费,为了节省成本,对万国码进行压缩,字母用1个字节表示,欧洲字符用两个字节表示,中国汉字用三个字节表示

4 进入中国的操作系统采用中国制定的Gb2312编码标准,而Unix和Linux皆采用的utf-8的编码标准

 

以上是关于Python学习----字符集编码的主要内容,如果未能解决你的问题,请参考以下文章

Python学习Day2笔记(字符编码)

python学习笔记_字符编码

Python学习-字符编码的理解

Python学习:字符编码及文件处理

Python学习,第二课 - 字符编码

python学习关于字符编码