py3学习-----编码格式简介

Posted zhenning-li

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了py3学习-----编码格式简介相关的知识,希望对你有一定的参考价值。

ascii:英文8位一个字节;

unicode:英文32位四个字节;中文32位四个字节;

utf-8:英文8位一个字节;中文24位三个字节;

gbk:英文8位一个字节;中文16位两个字节;

1.各个编码之间是二进制,相互不能识别,会产生乱码;

2.文件存储和传输不能使用unicode。可以使用utf-8,utf-16,gbk,gb2312,ascii等

py3中str在内存中使用unicode编码,与其他编码转换:

英文:str = ‘aaa‘ #unicode编码

   str = b‘aaa‘ #utf-8或者gbk等

中文:str = ‘中文’ #unicode编码

   str = ‘中文‘ #使用str.encode(‘utf-8‘).decode(‘utf-8‘)防止乱码

以上是关于py3学习-----编码格式简介的主要内容,如果未能解决你的问题,请参考以下文章

编码格式发展历史及简介

编码格式简介(ANSIGBKGB2312UTF-8GB18030和 UNICODE)

编码格式简介(ANSIGBKGB2312UTF-8GB18030和 UNICODE)

编码格式简介:ASCII码ANSIGBKGB2312GB18030和UnicodeUTF-8,BOM头

JAVA几种常见的编码格式(转)

UnicodeMath编码教程