python--编码问题
Posted loveelsa
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python--编码问题相关的知识,希望对你有一定的参考价值。
1、ASCii 占用一个字节,只支持英文
2、GB2312 占用2个字节,支持6700+ 汉字
3、GBK 升级版的2312 支持21000+汉字
4、unicode 2-4字节,
(1)、支持全球所有语言,编码统一
(2)、包含和全球所有各自的编码的映射关系
本地使用使用unicode没问题,因为本地计算机内存大,不care。但存储和网络传输时数据一多,占用多了一倍就有问题了
为了解决这个问题,UTF就诞生了,既对unicode的转换
utf-8 可变长编码,使用1-4个字符,英文是1个字符,欧洲2个字节,中文3个字节,其余特殊的就是4个字节
以上是关于python--编码问题的主要内容,如果未能解决你的问题,请参考以下文章