python:汉字编码

Posted 花田半亩2091

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python:汉字编码相关的知识,希望对你有一定的参考价值。

汉字编码

国标系列:

    GB18030 (二字节或四字节编码, 共27533个字)

    GBK (二字节编码, 共21003个字)

    GB2312 (二字节编码,共6763个汉字) (Windows常用)

国际标准:

     UNICODE <---> UTF-8 (Linux / Mac OS X / IOS / Android 等常用)

python编码字符串:

       ‘gb2312‘    ‘gbk‘        ‘gb18030‘          ‘utf-8‘          ‘ascii‘ ...

      以上字符串用于encode和 decode中

编码注释:

    在python源文件的第一行或第二行写入如下内容:

      # -*- coding:gbk -*-                  # 设置源文件编码格式为gbk

      或 # -*- coding:utf-8 -*-         # 设置源文件编码格式为utf-8

       作用: 告诉解释执行器,此前文件的编码是什么

以上是关于python:汉字编码的主要内容,如果未能解决你的问题,请参考以下文章

python去重(汉字一样,里面的编码不一样)?

python 汉字编码问题,请大神帮忙!!

Python学习笔记015——汉字编码

python 编码问题 u'汉字'

python中json序列化时汉字变成编码的解决方式

python 将unicode编码转换为汉字的几种方法