字符编码+文件处理

Posted zhangrenguo

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了字符编码+文件处理相关的知识,希望对你有一定的参考价值。

1,什么是字符编码?

字符编码表:人类的字符<--------->数字

ASCII码表:只能识别英文字符

用八个二进制位表示一个英文字符,1个英文字符=8bit

2,为何用字符编码

因为计算机无法识别人类的字符,人类与计算机打交道都是用人类的字符,而计算机无法识别人类的字符只能识别二进制,所以必须为人类的字符编码成计算机能识别的二进制数字

 

GBK:能识别汉字与英文

1个汉字=2个字节(bytes)=16个bit

1个英文字符=一个字节8bit

一个字节即1bytes=8个二进制位=8bit

Unicode:能识别万国字符,一个字符用两个字节即十六个bit

特点:能识别万国语言

与各个国家的字符编码都有映射关系

utf-8:一个bytes表示英文,三个bytes表示一个汉字

utf-8是Unicode的转换格式

 

重点:

编码:字符---------->编码---------->unicode的二进制---------->编码---------->GBK的二进制

解码:GBK的二进制---------->解码---------->unicode的二进制---------->解码---------->字符

 



以上是关于字符编码+文件处理的主要内容,如果未能解决你的问题,请参考以下文章

python-字符编码与文件处理

字符编码+文件处理

字符编码文件处理

字符编码和文件处理

字符编码和文件处理

字符编码与文件处理