python--编码问题

Posted loveelsa

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python--编码问题相关的知识,希望对你有一定的参考价值。

1、ASCii 占用一个字节,只支持英文

2、GB2312 占用2个字节,支持6700+ 汉字

3、GBK 升级版的2312   支持21000+汉字

4、unicode 2-4字节,

(1)、支持全球所有语言,编码统一

(2)、包含和全球所有各自的编码的映射关系

 

本地使用使用unicode没问题,因为本地计算机内存大,不care。但存储和网络传输时数据一多,占用多了一倍就有问题了

为了解决这个问题,UTF就诞生了,既对unicode的转换

utf-8 可变长编码,使用1-4个字符,英文是1个字符,欧洲2个字节,中文3个字节,其余特殊的就是4个字节

 

以上是关于python--编码问题的主要内容,如果未能解决你的问题,请参考以下文章

python编码问题

python抓网页的编码问题

原创python中文编码问题深入分析:python2.7文件读写中文编码问题

python ACSII编码问题

python编码的问题

python 编码问题