编码的小知识
Posted albatorss
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了编码的小知识相关的知识,希望对你有一定的参考价值。
编码方式:
ASCII
a 8位 一个字节
unicode
a 32位 四个字节
中 32位 四个字节
utf-8
a 8位 一个字节
中 24位 三个字节
gbk
a 8位 一个字节
中 16位 两个字节
1.各个编码之间的二进制,是不能相互识别的,会产生乱码。
2.文件的传输,储存不能是unicode(只能是utf-8,utf-16,gbk,gbk2312,ascii等)
Python3
str 在内存中使用unicode编码
对于英文:
str: 表现方式:s = ‘alex’
编码方式:01010101 unicode
bytes: 表现方式:s = b“alex”
编码方式:01010100 utf-8,gbk。。。
对于中文:
str: 表现方式;s = “中国”
编码方式:01010101 unicode
bytes: 表现方式:s = b‘xe93e91e30e02e32e42‘
编码方式:00010001 utf-8,gbk。。。
以上是关于编码的小知识的主要内容,如果未能解决你的问题,请参考以下文章