字符编码

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了字符编码相关的知识,希望对你有一定的参考价值。

py 2.0 上默认ASCII 不支持中文所以出现了GB2312

uncode 是万国编码 包含各个国家的字符 utf-8 是uncode 的一个扩展集

GBK兼容GB2312 

uncode 中文英文均为2字节 ASCII为一个字节 utf-8 英文1个字节中文3个字节

如果一个文件用GBK编码

另一个程序用utf-8编写

由于GBK与utf-8不能互译

需要将GBK 解码为uncode (decode)再编码(encode)utf-8

py3.0默认为uncode

声明编码

#-*- codin:utf-8 -*- 

以上是关于字符编码的主要内容,如果未能解决你的问题,请参考以下文章

如何查看字符编码类型

Python 字符集编码 - UTF-8 编码

unicode字符集是多少位的字符编码

刨根究底字符编码之九——字符编码方案的演变与字节序

公众号回复表情 和 关于字符集和字符编码

编码方式的编码方式