ASSCII GB2312 Unicode UTF-8

Posted 朝夕闻道

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ASSCII GB2312 Unicode UTF-8相关的知识,希望对你有一定的参考价值。

前序:
经常被各种字符编码搞混淆,尤其在涉及到文件处理和文件传输,以及中文注释等时,特精简总结下常用的字符编码,以便后记。

ASSCII:
最早、最精简的字符编码,127个字符,大小写、数字、符号等;
单字节;

GB2312:
加入中文集,不与ASSCII冲突;

Unicode:
实现多国家的编码,2-4字节;
常用2字节,生僻的用4字节;
兼容ASCII;
常用,但带来空间和内存的消耗;

UTF-8:
1-6字节;
英文1个字节,中文3个字节;
兼容ASSCII;

计算机系统常用编码工作方式:
计算机内存中统一使用Unicode;当需要保存到硬盘或者进行传输的时候,转换为TTF-8;
比如从记事本打开编辑时,文件从UTF-8字符转化为Unicode到内存中,当编辑完以后,再转化为UTF-8到文件,到硬件中。
浏览网页时,服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器(由于对网页不是很懂,暂时没法理解);

以上是关于ASSCII GB2312 Unicode UTF-8的主要内容,如果未能解决你的问题,请参考以下文章

字符编码-深入理解ASCII,GB2312,GBK,Unicode,UTF-8

C语言UTF8要怎样转gb2312

字符编码的前世今生(Unicode,UTF, GB2312)

编码格式简介(ANSIGBKGB2312UTF-8GB18030和 UNICODE)

编码格式简介(ANSIGBKGB2312UTF-8GB18030和 UNICODE)

编码格式简介(ANSIGBKGB2312UTF-8UTF-16GB18030和 UNICODE)