编码格式
Posted dangdanghepingping
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了编码格式相关的知识,希望对你有一定的参考价值。
三种编码格式:
最原始: ASKII: 只能表示128个字符;
为什么是128?
计算机内存的最小单位是字节, 一个字节是八位二进制. 为什么是二进制, 因为电信号最有效的传递方式就是正负传递.
为什么是八位, 谁规定的? 美国人, 当初计算机储存诞生时候就这么定义的, 网络通信中物理层以太网协议规定传输最小单位也是八位二进制;
128是因为八位数,当时觉得用不到就留着第一位空着,每个数都能显示两种状态, 排列组合为2的七次方.
可能无数中国人在骂祖宗,为什么中国祖先没有发明计算机
一统江湖: Unicode编码
128个字符显然不够其他国家用, 为了适应全球, Unicode这种编码诞生.
每个符号长度为3个字节.
但是还是不很好,有些原先能够一个字节表示的字符,用三个字节表示, 内存占用大了两倍.
优化: utf-8
可变字节, 有自己的排列原则, 适合大规模的处理数据.
以上是关于编码格式的主要内容,如果未能解决你的问题,请参考以下文章