python文件操作 二

Posted 爱陪小樱桃

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python文件操作 二相关的知识,希望对你有一定的参考价值。

问题:在传输的时候对方不知道是以什么格式传给用户,传来传去彼此都忘了什么格式:

    在编码的时候:utf8:是3个字符,gbk是2个字符,每个字符数字对应的字符,一段2进制串,如果10个字节全部都是中文,永远不能是utf-8,但是又要存成中文,就只能是gbk了,第三方的工具箱,会自动检测这段文字是什么编码。

问题:假如你不知道你要处理的文件是什么格式编码可怎么办呢?

#如果想用chardet需要安装第三方的工具包chardet
import chardet
f=open(\'log\',mode=\'rb\')
data=f.read()
f.close()
result=chardet.detect(open(\'log\',mode=\'rb\').read())
print(result)

2.如下交大家安装chardet,

以上文件自己创建和编写(可以编写gbk格式,或者其他的格式,自己使用上边的代码进行检测)

执行的结果是个:字典;具体结果可以自行查看;

3.对于我们上边的文件如果是会显示GB2312的编码,我们可以吧它转换为对应的编码格式;Unicode

data.decode("gb2312")

四:现在是文件内容比较小,如果文件内容比较大,我们怎么办呢?

 

以上是关于python文件操作 二的主要内容,如果未能解决你的问题,请参考以下文章

OpenGL基础学习之二代码基本结构

为什么二代测序的原始数据中会出现Read重复现象?

二代身份证号码编码规则

染色体基因芯片分析和第二代测序应用的区别

python之day3(文件操作字符转码函数)

ffmpeg转码重置文件的开始时间