前序:
经常被各种字符编码搞混淆,尤其在涉及到文件处理和文件传输,以及中文注释等时,特精简总结下常用的字符编码,以便后记。
ASSCII:
最早、最精简的字符编码,127个字符,大小写、数字、符号等;
单字节;
GB2312:
加入中文集,不与ASSCII冲突;
Unicode:
实现多国家的编码,2-4字节;
常用2字节,生僻的用4字节;
兼容ASCII;
常用,但带来空间和内存的消耗;
UTF-8:
1-6字节;
英文1个字节,中文3个字节;
兼容ASSCII;
计算机系统常用编码工作方式:
计算机内存中统一使用Unicode;当需要保存到硬盘或者进行传输的时候,转换为TTF-8;
比如从记事本打开编辑时,文件从UTF-8字符转化为Unicode到内存中,当编辑完以后,再转化为UTF-8到文件,到硬件中。
浏览网页时,服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器(由于对网页不是很懂,暂时没法理解);