汉字编码

Posted lumc5

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了汉字编码相关的知识,希望对你有一定的参考价值。

机内码、国际码、区位码之间的换算

字符编码的两种表示方式

    ASCII(字符的表示);GB2312(国标码,汉字编码)

 

  区位码:1980年,为了使每个汉字有一个全国统一的代码,我国颁布了汉字编码的国家标准:GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。

  国际码:在汉字计算机编码标准中,目前最大的汉字编码是台湾的标准CNS11643,目前(4.0)共收录可考证之繁简、日、韩语汉字共76,067个,但并不普及,只有在户政系统等少数环境使用。

  机内码:国家标准局颁布的《信息交换用汉字编码字符集基本集》(代号为GB2312 80)规定的汉字交换码作为国家标准汉字编码。

 

 

汉字编码的换算:

    一、将区位码转换为国标码.两区位码改写成十六进制,XXOOH.XX是区码,OO是卫码H代表十六进制.将XXOOH加2020H得到的就是国标码。

    二、国标码转换成机内码.将所得到的国标码加8080H,就可得机内码。

      如果是机内码转化成国标码,或者是国标码转化成区位码,做减法就可以了

      区位码、国标码与机内码的转换关系方法:

      (1)区位码先转换成十六进制数表示 

      (2)(区位码的十六进制表示)+2020H=国标码; 

      (3)国标码+8080H=机内码 

        举例:以汉字“大”为例,“大”字的区内码为2083

        1、区号为20,位号为83 

        2、将区位号2083转换为十六进制表示为1453H 

        3、1453H+2020H=3473H,得到国标码3473H 

        4、3473H+8080H=B4F3H,得到机内码为B4F3H 

字符编码的两种表示方式:ASCII(字符的表示);GB2312(国标码,汉字编码)

进制的转换计算

例如:

把256转换成16进制。

256÷16=16……0,

16÷16=1……0,

1÷16=0……1,

所以,256转换成16进制就是100。

 

以上是关于汉字编码的主要内容,如果未能解决你的问题,请参考以下文章

Qt的QString中储存汉字,如何查看汉字的编码

请问一个关于URL中汉字编码解码的问题

delphi返回一个汉字的Unicode编码

MsSQL中汉字默认编码是UTF8还是GBK?应该怎样调整

用JS将URL中的汉字编码成GBK,怎么弄?

汉字编码