关于gbk, gb2312,unicode,utf-8等字符编码的问题

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了关于gbk, gb2312,unicode,utf-8等字符编码的问题相关的知识,希望对你有一定的参考价值。

对于字符编码,时间长了很容易搞混,这里不在阐述各个字符集的来龙去脉,仅记下结论:

  1. ascii : 8bit, 主要存放的是英?文, 数字, 特殊符号
  2. gb2312:16bit,简体字版中文
  3. gbk: 16bit, 主要存放中?文和亚洲字符. 兼容ascii和gb2312
  4. unicode: 16bit和32bit两个版本. 平时我们?用的是16bit这个版本. 全世界所有国家的?文 字信息. 缺点: 浪费空间(传输和存储)
  5. utf-8 : 可变?长度unicode, 英?文: 8bit, 欧洲?文字: 16bit, 中?文24bit. 一般数据传输和存储的时候使?

以上是关于关于gbk, gb2312,unicode,utf-8等字符编码的问题的主要内容,如果未能解决你的问题,请参考以下文章

位/字节/ASCII/UTF-8/GBK/GB2312/Unicode 扫盲

关于gbk, gb2312,unicode,utf-8等字符编码的问题

unicode utf-8 utf-16ascii gbk gb2312 的区别

如何把utf-8编码的转换为gb2312

C# 转换编码 如何从utf-8转换到gb2312

C语言UTF8要怎样转gb2312