python中的编码
Posted 洛水卿卿
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python中的编码相关的知识,希望对你有一定的参考价值。
编码
ascii码
一个字符占8位,用一个字节表示
A:00000010 8位 一个字节
Unicode
一个字符占32位,用四个字节表示
A :00000000 00000001 00000010 00000100 32位 四个字节
中:00000000 00000001 00000010 00000110
utf-8
A:00000010 8位 一个字节
中:00000000 00000001 00000110 24位 三个字节
gbk:
A:00000010 8位 一个字节
中:00000000 00000110 16位 两个字节
注意:
1. 各个编码的二进制不能互相识别,会产生乱码
2. 文件的储存、传输,不能是Unicode(只能是utf-8/16/gbk/gbk2312/ascii码进行存储和传输)
python3中
字符串在内存中使用Unicode储存的
bytes类型编码方式:utf-8,gbk,gb2313,ascii
对于英文:
str:
表现形式 s=‘alex‘
编码方式 010101010 unicode
bytes:
表现形式 s=b‘alex‘
编码方式 000101010 utf-8/gbk
对于中文:
str:
表现形式 s=‘中国‘
编码方式 010101010 unicode
bytes:
表现形式 s=b‘xe91e91e01e21e31e32‘
编码方式 000101010 utf-8/gbk....
将str转换成bytes类型(传输和存储必须是bytes类型)
s1=‘alex‘ s2=s1.encode(‘utf-8‘) print(s2) #b‘alex‘
以上是关于python中的编码的主要内容,如果未能解决你的问题,请参考以下文章
markdown 打字稿...编码说明,提示,作弊,指南,代码片段和教程文章
在 Python 多处理进程中运行较慢的 OpenCV 代码片段