GBK,ISO-8859-1,GB2312的本质区别

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了GBK,ISO-8859-1,GB2312的本质区别相关的知识,希望对你有一定的参考价值。

不要复制一大堆来 看的很累
我只想说在做编程的时候 iso-8859-1,GBK,gb2312 这3种表现文字的方式有什么不同
有的人说GBK可以包括繁体中文 gb2312是简体中文 这个说法对不对.
那iso-8859-1呢?
我也知道形式不一样。但是为什么不一样?
大哥.你可否说几句啊?

参考技术A 编码有几种
计算机最初是在美国等国家发明的 所以表示字符只有简单的几个字母只要对字母进行编码就好 我们标准码 iso-8859-1 这就是一个标准

但是后来计算机普及了 于是就中国要使用计算机了 但是机器不认得中文啊 怎么半于是就是有了国际码(比方哦) gbk gb2312 这都是这类的 两个其实一个` 一个是标准 发布的代号一个是简称

后来多了个阿拉伯 奶奶的他和原理们的字符更过` 跟牛毛似的所以就出来统一编码 . 要了解编码的方式可以在baidu里 找找本回答被提问者采纳
参考技术B 同问,等高手解答^_^ 参考技术C 编码的形式不一样。。

当然就不一样了

中文编码如何选择?

1、收录汉字
GB2312:基本集共收入汉字6763个和非汉字图形字符682个。

GBK:共收录了21003个汉字。7a686964616fe78988e69d8331333431366265

GB18030:共收录汉字70244个。

2、兼容性

GB2312:基本满足了汉字的计算机处理需要,对于人名、古汉语等方面出现的罕用字,GB 2312不能处理。

GBK:GBK 向下与 GB 2312 编码兼容,向上支持 ISO 10646.1国际标准。

GB18030:对GB 2312-1980完全向后兼容,与GBK基本向后兼容,并支持Unicode(GB 13000)的所有码位。

3、发布时间

GB2312:由中国国家标准总局1980年发布,1981年5月1日开始实施。

GBK:1995年12月1日制订。

GB18030:初版于2000年3月17日发布,现行版本于2005年11月8日发布,2006年5月1日实施。

4、编码

GB2312:通常采用EUC储存方法,以便兼容于ASCII。每个汉字及符号以两个字节来表示。

GBK:GBK是采用单双字节变长编码,英文使用单字节编码,完全兼容ASCII字符编码,中文部分采用双字节编码。

GB18030 :GB18030包含三种长度的编码:单字节的ASCII、双字节的GBK(略带扩展)、以及用于填补所有Unicode码位的四字节UTF区块。


显而易见选择GB18030能最大程度的支持中文,包括繁体等。

以上是关于GBK,ISO-8859-1,GB2312的本质区别的主要内容,如果未能解决你的问题,请参考以下文章

常用编码详解

网页post和get方法中的中文乱码问题详解

网页post和get方法中的中文乱码问题详解

UNICODE,GBK,UTF-8区别

怎样将GB2312编码的字符串转换为ISO-8859-1编码的字符串?

java获取字符串编码和转换字符串编码