python 转换文件编码格式
Posted 韩搏
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 转换文件编码格式相关的知识,希望对你有一定的参考价值。
开发中使用脚本分析日志,遇到编码不可解析问题,故做了转换
#coding: utf-8
import os
import sys
import chardet
import codecs
def checkFileCharset(self, file_path):
with open(file_path, "rb") as f:
data = f.read(4)
charset = chardet.detect(data)['encoding']
return charset
def convertEncoding(self, filename):
source_encoding = checkFileCharset(filename)
print("convertEncoding file name:%s encode:%s" % (filename, source_encoding))
if source_encoding.find("UTF-8") < 0:
content = codecs.open(filename, 'r', encoding=source_encoding).read()
# content = content.decode(source_encoding, 'ignore')# .encode(source_encoding)
codecs.open(filename, 'w', encoding="UTF-8-SIG").write(content)
if __name__=="__main__":
if len(sys.argv) >= 2:
convertEncoding(sys.argv[1])
以上是关于python 转换文件编码格式的主要内容,如果未能解决你的问题,请参考以下文章
SourceInsight解决中乱码问题,python脚本批量实现文件的编码转换