初识编码

Posted ychihior

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了初识编码相关的知识,希望对你有一定的参考价值。

01010100011101110101011110110
A B C
01000001 01000010 01000011
电报,电脑的传输,存储都是01010101
 
最早的‘密码本‘ ascii 涵盖了英文字母大小写,特殊字符,数字。
01010101
ascii 只能表示256种可能,太少, 

创办了万国码 unicode
    16表示一个字符不行,32位表示一个字符。
    A  01000001010000010100000101000001
    B  01000010010000100100001001000010
    我 01000010010000100100001001000010
 
Unicode 升级 utf-8  utf-16 utf-32
    8位 = 1字节bytes
    utf-8 一个字符最少用8位去表示,英文用8位  一个字节
          欧洲文字用16位去表示                两个字节
          中文用24 位去表示                   三个字节
    utf-16 一个字符最少用16位去表示
gbk 中国人自己发明的,一个中文用两个字节 16位去表示。
11000000
 
1bit    8bit = 1bytes 
1byte   1024byte = 1KB
1KB     1024kb = 1MB
1MB     1024MB = 1GB
1GB     1024GB = 1TB

以上是关于初识编码的主要内容,如果未能解决你的问题,请参考以下文章

字符编码初识

编码初识

初识编码 gbk unicode utf-8

第六节,初识python和字符编码

初识编码

基础数据类型补充以及编码初识