python之编码decode

Posted chif

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python之编码decode相关的知识,希望对你有一定的参考价值。

ASCII
8位 一个字节 表示 比如A : 00000010
Unicode
32位 4个字节 表示 比如A:00000000 00000001 00000010 00000100
中文也是32位
utf-8 8 位一个字节表示 比如 A:00100000
中文24位3个字节 : 0000001 00000000 00000000
gbk 英文 8位 一个字节
中文 16位 两个字节

1.各个编码之间的二进制,是不能互相识别的,会产生乱码。
2.文件的储存,传输,不能是unicode(只能是utf-8 utf-16 gbk gb2312 ASCII)

python3的str,在内存中是用Unicode编码的。
bytes类型
对于英文:str : 表现形式:s=‘alex’
编码方式:01010101 unicode
bytes:表现形式: s=b’alex’
编码方式:01010101 gbk utf-8等等
对于中文:str: 表现形式:‘中国‘
编码形式:01010101 Unicode
bytes:表现形式:b‘xe97e91e21e21e32e15
编码形式:
encode 编码
将Unicode转换成utf-8或者gbk
将str--》bytes:s11=s1.encode(‘utf-8’)

 






















以上是关于python之编码decode的主要内容,如果未能解决你的问题,请参考以下文章

python基础之六:编码简介以及python3中的编码

python03之编码学习

python之字符编码

python之字符编码

Python 之 字符转编码操作

Python全栈开发之Python基础-字符编码与转码