第二讲：编码详解，防止中文乱码

Posted 2021-12-01 wenxiacui

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了第二讲：编码详解，防止中文乱码相关的知识，希望对你有一定的参考价值。

编码详解

编码支持：

ASCII编码：美国信息交换标准代码（American Standard Code for InformationInterchange，简称ASCII）是一种用于信息交换的美国标准代码，它的作用是给英文字母、数字、标点、字符转换成计算机能识别的二进制数规定了一个大家都认可并遵守的标准。
GB2312编码：适用于汉字处理、汉字通信等系统之间的信息交换
GBK编码：是汉字编码标准之一，是在 GB2312-80 标准基础上的内码扩展规范，使用了双字节编码
ANSI是与你使用的windows操作系统的语言有关系的，向windows 7 简体中文版就是GBK（用一个字节表示英文，用两个字节表示一个中文）
Unicode编码：这是一种世界上所有字符的编码，但是它没有规定的存储方式。Unicode标准也在不断发展，但最常用的是用两个字节表示一个字符（如果要用到非常偏僻的字符，就需要4个字节）。现代操作系统和大多数编程语言都直接支持Unicode。
UTF-8编码：是 Unicode Transformation Format - 8 bit 的缩写， UTF-8 是 Unicode 的一种实现方式。它是可变长的编码方式，可以使用 1~4 个字节表示一个字符，可根据不同的符号而变化字节长度。UTF-8编码有一个额外的好处，就是ASCII编码实际上可以被看成是UTF-8编码的一部分，大量只支持ASCII编码的历史遗留软件可以在UTF-8编码，继续工作。

可以这么理解，unicode包括utf-8,utf-8包括gbk，gbk包括gb2312。

一、文件格式防止中文乱码三部曲：

第一步：把文件保存为utf-8格式；

技术图片