一句话理解字符编码(Unicode ,UTF8,UTF16)

Posted 飞错的雪

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了一句话理解字符编码(Unicode ,UTF8,UTF16)相关的知识,希望对你有一定的参考价值。

  Unicode和ASCII码属于同一级别的,都是字符集,字符集规定从1到这个字符集的最大范围每个序号都各表示什么意思。比如ASCII字符集中序号65表示“A”。

那接下来的UTF8和UTF16就相当于我们在计算机中怎么表示这个序号了。这就好比,通常情况下我们用十进制表示数字(1表示一个,2表示两个)。但是有时候我们也会根据情况用二进制,八进制,十六进制表示。

UTF8编码规则表示一个序号可能用一个字节/两个字节/三个字节来表示。UTF16编码规则表示一个序号只会用两个字节表示。其他的编码规则例如GB2312/GBK也都类似。

  最后,可以用一句话理解并记住他们的区别:把UTF8/UTF16/GB2312/GBK编码规则理解成一种进制,解析的时候把他们转换成十进制然后查询字符集表即可。

 

转载请注明出处。

以上是关于一句话理解字符编码(Unicode ,UTF8,UTF16)的主要内容,如果未能解决你的问题,请参考以下文章

Unicode 和 UTF-8关系

Pyhon 中文编码问题(字符串前加‘U’)

unicode和utf8

公众号回复表情 和 关于字符集和字符编码

编码问题

Java检测文件是否UTF8编码