Python 学习之[编码]

Posted charles-lin

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python 学习之[编码]相关的知识,希望对你有一定的参考价值。

全世界最早的编码是ASCII 最早只有 256个bit 8位 但是只用了128位 剩下一位补零。最早是美国人发明的 只支持英文 数字 和符号 一个字母是 8bit=1byte

随着计算机的世界普遍应用。各个国家创建了自己的编码系统如:中国的GB 后来衍生成GBK

GBK是由GB衍生而来,由中国方正公司编码研制 65536个bit 16位  但是其数量远小于中国的汉字数量。每个字占16bit=2byte

最早的世界性编码是UNICODE 为了全世界研制的编码 有32位 2**32个空位,但是因为占用空间比较大所以早期没有太广泛的使用。 每个字在unicode 中占 32bite=4byte

随后产生了utf-8 目前比较广泛应用的编码之一,他的特点是可以延长编码。如英文在utf-8中占8位 1byte 欧洲国家文字 占16位 2byte 中文 占24位 3byte.utf8是兼容ASCII编码的

 

以上是关于Python 学习之[编码]的主要内容,如果未能解决你的问题,请参考以下文章

python学习之字符编码

Python 学习之[编码]

python学习之内部执行流程,内部执行流程,编码

python学习之爬虫:BeautifulSoup

python机器学习之特征降维

python学习之HTML