编码格式

Posted dangdanghepingping

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了编码格式相关的知识,希望对你有一定的参考价值。

三种编码格式:

       最原始:  ASKII: 只能表示128个字符; 

                    为什么是128?

                    计算机内存的最小单位是字节, 一个字节是八位二进制. 为什么是二进制, 因为电信号最有效的传递方式就是正负传递. 

                    为什么是八位, 谁规定的? 美国人, 当初计算机储存诞生时候就这么定义的, 网络通信中物理层以太网协议规定传输最小单位也是八位二进制;

                    128是因为八位数,当时觉得用不到就留着第一位空着,每个数都能显示两种状态, 排列组合为2的七次方.

              可能无数中国人在骂祖宗,为什么中国祖先没有发明计算机

       一统江湖: Unicode编码

               128个字符显然不够其他国家用, 为了适应全球, Unicode这种编码诞生.

               每个符号长度为3个字节. 

               但是还是不很好,有些原先能够一个字节表示的字符,用三个字节表示, 内存占用大了两倍.

       优化: utf-8

              可变字节, 有自己的排列原则, 适合大规模的处理数据.

        

                    

以上是关于编码格式的主要内容,如果未能解决你的问题,请参考以下文章

如何检查TXT文本是否ANSI编码格式的?

java 怎么获得文件编码格式

怎么把文件的编码格式转换成ANSI

怎么把文件的编码格式转换成ANSI

linux下修改文件编码格式

如何批量修改linux 文件编码格式