字符编码+文件处理
Posted zhangrenguo
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了字符编码+文件处理相关的知识,希望对你有一定的参考价值。
1,什么是字符编码?
字符编码表:人类的字符<--------->数字
ASCII码表:只能识别英文字符
用八个二进制位表示一个英文字符,1个英文字符=8bit
2,为何用字符编码
因为计算机无法识别人类的字符,人类与计算机打交道都是用人类的字符,而计算机无法识别人类的字符只能识别二进制,所以必须为人类的字符编码成计算机能识别的二进制数字
GBK:能识别汉字与英文
1个汉字=2个字节(bytes)=16个bit
1个英文字符=一个字节8bit
一个字节即1bytes=8个二进制位=8bit
Unicode:能识别万国字符,一个字符用两个字节即十六个bit
特点:能识别万国语言
与各个国家的字符编码都有映射关系
utf-8:一个bytes表示英文,三个bytes表示一个汉字
utf-8是Unicode的转换格式
重点:
编码:字符---------->编码---------->unicode的二进制---------->编码---------->GBK的二进制
解码:GBK的二进制---------->解码---------->unicode的二进制---------->解码---------->字符
以上是关于字符编码+文件处理的主要内容,如果未能解决你的问题,请参考以下文章