字符编码
Posted zhangshengxiang
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了字符编码相关的知识,希望对你有一定的参考价值。
一 储备知识点1
运行程序的三大核心硬件
cpu
内存
硬盘
运行一个程序:
代码由硬盘读入内存,cpu从内存中读取指令执行
强调:程序运行过程中产生的数据一定是最先存放于内存中的
二 储备知识点2
运行python程序的三个阶段:python test.py
1、先启动python解释器
2、将test.py的内容当作普通字符读入内存
3、python解释器解释执行读入内存的代码,识别python的语法
python解释器运行程序的前两个阶段跟文本编辑器一模一样
只有第三个阶段不同
三 字符编码
人操作计算机使用人类认识的字符,而计算机存放都是二进制数字
所以人在往计算机里输入内容的时候,必然发生:
人类的字符------(字符编码表)--------》数字
ASCII: 用(8位bit二进制数)1Bytes对应一个英文字符
8bit= 1Bytes
1024Bytes=1KB
1024KB=1MB
1024MB=1GB
1024GB=1TB
1024TB=1PB
GBK:用2Bytes对应一个中文字符,1Bytes对应一个英文字符
unicode:用2Bytes对应一个字符
必须满足两大特点:
1、能够兼容万国字符
2、与老字符编码都有一种数字与数字的对应关系
a 1111 0111
a 0000 0000 1111 0111
utf-8:Unicode Transformation Format
一个中文字符:3bytes
一个英文字符:1bytes
强调:
unicode格式的数字--------encode编码---------》utf-8格式的数字
unicode格式的数字《--------decode解码《---------utf-8格式的数字
以上是关于字符编码的主要内容,如果未能解决你的问题,请参考以下文章