字符编码

Posted zhangshengxiang

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了字符编码相关的知识,希望对你有一定的参考价值。

一 储备知识点1
    运行程序的三大核心硬件
        cpu
        内存
        硬盘

    运行一个程序:
        代码由硬盘读入内存,cpu从内存中读取指令执行

    强调:程序运行过程中产生的数据一定是最先存放于内存中的

二 储备知识点2
    运行python程序的三个阶段:python test.py
        1、先启动python解释器
        2、将test.py的内容当作普通字符读入内存
        3、python解释器解释执行读入内存的代码,识别python的语法

        python解释器运行程序的前两个阶段跟文本编辑器一模一样
        只有第三个阶段不同


三 字符编码
    人操作计算机使用人类认识的字符,而计算机存放都是二进制数字
    所以人在往计算机里输入内容的时候,必然发生:
        人类的字符------(字符编码表)--------》数字


        ASCII: 用(8位bit二进制数)1Bytes对应一个英文字符
            8bit= 1Bytes
            1024Bytes=1KB
            1024KB=1MB
            1024MB=1GB
            1024GB=1TB
            1024TB=1PB

        GBK:用2Bytes对应一个中文字符,1Bytes对应一个英文字符

        unicode:用2Bytes对应一个字符
            必须满足两大特点:
                1、能够兼容万国字符
                2、与老字符编码都有一种数字与数字的对应关系
        a 1111 0111
        a 0000 0000 1111 0111


        utf-8:Unicode Transformation Format
            一个中文字符:3bytes
            一个英文字符:1bytes


        强调:
            unicode格式的数字--------encode编码---------》utf-8格式的数字
            unicode格式的数字《--------decode解码《---------utf-8格式的数字

































以上是关于字符编码的主要内容,如果未能解决你的问题,请参考以下文章

如何查看字符编码类型

Python 字符集编码 - UTF-8 编码

unicode字符集是多少位的字符编码

刨根究底字符编码之九——字符编码方案的演变与字节序

公众号回复表情 和 关于字符集和字符编码

编码方式的编码方式