Python 中文编码

Posted 水郁

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python 中文编码相关的知识,希望对你有一定的参考价值。

# -*- coding:utf-8 -*-
# ASCII 是一种单字节的编码,可表示256个不同字符
# 中文 在 python3 中默认用 unicode编码
lst = ['你',        # str类型,unicode编码
    str('你'), # 同上
    u'你', # 同上
    '你'.encode('utf-8').decode('utf-8'), # 同上
    # encode 将 str 转为 bytes 类型,可以再用 decode 转回 str 类型
    
    '你'.encode('utf-8'), # b'xe4xbdxa0',utf-8编码,一个汉字 3 Byte
    '你'.encode('gbk'), # b'xc4xe3',gbk、gbxxxx 编码,一个汉字 2 Byte
    '你'.encode('GB2312') # 同上
    ]

for word in lst:
    print (word, type(word))

以上是关于Python 中文编码的主要内容,如果未能解决你的问题,请参考以下文章

从 XML 声明片段获取 XML 编码:部分内容解析不支持 XmlDeclaration

使用非utf-8编码在Python中解析XML

Python 向 Postman 请求代码片段

使用 Python 代码片段编写 LaTeX 文档

以下代码片段 C++ 的说明

Python之如何优雅的重试