编码方式
Posted 777
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了编码方式相关的知识,希望对你有一定的参考价值。
一
1.unicode只是一种编码方式。
ASCII码:127个数字: 对应7个比特位————> 美国——占1个字 节
扩展ASCII码:256个数字:8个比特位——————>拉丁——占1个字 节
中文扩展ASCII码(GB2312): 几千个状态————>中国——占2个 字节
中文扩展ASCII码(GBK):两万多个状态—————中国---占1个字 节
Unicode(万国码):———六七万个字节———全世界----都是2个 字节
UTF8(美国人伤不起,在万国码基础上改进成能伸能缩的编码方 式):
英文1个字节,非英文考虑两个或三个,中国变成3个字节了!坑!
2.编码与解码。
我们向软件输入文字并保存的过程(编码过程):
其实是软件先将你的明文字符扔到内存,它是以unicode编码方式转成二进制扔到内存里的,而后不能以utf8编码方式的二进制写到硬盘上(因为utf8占空间),它在内存里再把unicode编码的二进制转成utf8编码方式的二进制数。
unico是:明文——>unico二进制——>utf8二进制——>磁盘
我们从硬盘里打开保存的文件(解码过程):
utf8它不能直接将二进制转化成明文,所以:
utf8二进制——>unicode二进制——>内存——>明文
以上是关于编码方式的主要内容,如果未能解决你的问题,请参考以下文章