python_判断字符串编码的方法

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python_判断字符串编码的方法相关的知识,希望对你有一定的参考价值。

1. 安装chardet

    在命令行中,进入Python27\Scripts目录,输入以下的命令:easy_install chardet

2. 操作

import chardet
f = open(file,r)
fencoding=chardet.detect(f.read())
print fencoding

fencoding输出格式 {‘confidence‘: 0.96630842899499614, ‘encoding‘: ‘GB2312‘} ,只能判断是否为某种编码的概率。比较准确的结果了。输入参数为str类型。

备注:

  • str利用decode方法根据str的编码将其解码为unicode字符串类型
  • str利用encode根据特定的编码将unicode字符串类型转换为特定的编码

以上是关于python_判断字符串编码的方法的主要内容,如果未能解决你的问题,请参考以下文章

python识别文言文

通过查看编码映射表确定编码类型

Python基础 | 字符串操作

Python不归路_字符编码操作

php怎样判断字符串是啥编码

Python爬虫系列:判断目标网页编码的几种方法