unicode字符集是多少位的字符编码

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了unicode字符集是多少位的字符编码相关的知识,希望对你有一定的参考价值。

unicode编码用2个字节存储字符。

2个字节=16个bit,即16位二进制编码。

注意:一个bit=一位二进制。

最初的unicode编码是固定长度的,16位,也就是2两个字节代表一个字符,这样一共可以表示65536个字符。显然,这样要表示各种语言中所有的字符是远远不够的。

Unicode4.0规范考虑到了这种情况,定义了一组附加字符编码,附加字符编码采用2个16位来表示,这样最多可以定义1048576个附加字符,目前unicode4.0只定义了45960个附加字符。

扩展资料:

字母和数字的 ASCII 码的记忆是非常简单的。我们只要记住了一个字母或数字的 ASCII 码(例如记住 A 为 65 , 0 的 ASCII 码为 48 ),知道相应的大小写字母之间差 32 ,就可以推算出其余字母、数字的 ASCII 码。

虽然标准 ASCII 码是 7 位编码,但由于计算机基本处理单位为字节( 1byte = 8bit ),所以一般仍以一个字节来存放一个 ASCII 字符。每一个字节中多余出来的一位(最高位)在计算机内部通常保持为 0 (在数据传输时可用作奇偶校验位)。

参考资料来源:百度百科-字符编码

参考技术A Unicode用4个字节,数字0-0x10FFFF来映射字符,有1114112个码位。码位就是可以分配给字符的数字。全世界的字符加起来也用不了所有的码位。本回答被提问者采纳

以上是关于unicode字符集是多少位的字符编码的主要内容,如果未能解决你的问题,请参考以下文章

java中如何获得一个字符的unicode编码

中文字符替换为其unicode编码值小3的字符

如何判断一个字符串是不是是unicode编码?

一个汉字到底是多少个字符,高手请进

Python 字符集编码 - UTF-8 编码

Python的字符串编码