再次复习下ASCII码,unicode,utf-8是怎么回事:
最初的编码是ASCII码,每个英文占1字节,不能存储中文;为了统一世界各国的编码出现了unicode,但是在unicode中不管中文英文都占2字节,也就是原本1M的文件变成了2M,
造成了空间浪费;于是出现了unicode的扩展版本utf-8,在utf-8中英文仍然按照ASCII码的规则占1字节,汉字占3字节。
GBK和UTF-8如何转换:(中文windows默认编码集是gbk),utf-8和unicode之间不转换是可以互相打印的,但是gbk和inicode之间必须转换才能打印