python之chardet库

Posted TTyb

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python之chardet库相关的知识,希望对你有一定的参考价值。

chardet库是python的字符编码检测器,能够检测出各种编码的类型,例如:

1 import chardet
2 import urllib.request
3 
4 testdata = urllib.request.urlopen(http://m2.cn.bing.com/).read()
5 print(chardet.detect(testdata))

运行结果:

{‘confidence‘: 0.99, ‘encoding‘: ‘utf-8‘}

翻译一下就是:

{‘精准度‘: 99%, ‘encoding(编码形式)‘: ‘utf-8‘}

没见识到这个库之前所有编码纯属自己的记忆:

\u4e2d\u56fd
\xd6\xd0\xb9\xfa
中国
%e4%b8%ad%e5%9b%bd
%d6%d0%b9%fa

这些编码纯属需要眼睛辨认再去网上查找编码

现在发现了chardet这个库后方便了很多  

 

以上是关于python之chardet库的主要内容,如果未能解决你的问题,请参考以下文章

python第三方库-字符串编码工具 chardet 的使用(python3经典编程案例)

python第三方库-字符串编码工具 chardet 的使用(python3经典编程案例)

python之chardet验证编码格式

解析文件格式采用chardet库

python 的 chardet 安装完成了缺无法导入怎么办

python 模块 chardet下载及介绍