Python学习----字符集编码
Posted tonytang271828
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python学习----字符集编码相关的知识,希望对你有一定的参考价值。
1 ASCII码: American Standard Code for information inerchange
美国最初采用的二进制和字符的编码映射表
2 Gb2312, Gbk1.0, Gbk10830
中国最开始制定的编码表Gb2312,只包含简体字,后发现繁体字没有加进去,不断扩充,而出现了Gbk系列编码
3 unicode, utf-8
由于世界各国都制定本国的编码表,导致各国之间信息交流出现障碍,遂ISO组织出面制定全球统一的编码表,即unicode码,又称万国码。
万国码虽然包括了世界各国所有的字符,但是每个字符都用两个字节表示,对于英语国家来说,造成了大量的空间浪费,为了节省成本,对万国码进行压缩,字母用1个字节表示,欧洲字符用两个字节表示,中国汉字用三个字节表示
4 进入中国的操作系统采用中国制定的Gb2312编码标准,而Unix和Linux皆采用的utf-8的编码标准
以上是关于Python学习----字符集编码的主要内容,如果未能解决你的问题,请参考以下文章