python 转换文件编码格式

Posted 韩搏

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 转换文件编码格式相关的知识,希望对你有一定的参考价值。

开发中使用脚本分析日志,遇到编码不可解析问题,故做了转换

#coding: utf-8
import os 
import sys
import chardet
import codecs

def checkFileCharset(self, file_path):
	with open(file_path, "rb") as f:
		data = f.read(4)
		charset = chardet.detect(data)['encoding']
	return charset
		
def convertEncoding(self, filename):
	source_encoding = checkFileCharset(filename)
	print("convertEncoding file name:%s encode:%s" % (filename, source_encoding))
	if source_encoding.find("UTF-8") < 0:
		content = codecs.open(filename, 'r', encoding=source_encoding).read()
		# content = content.decode(source_encoding, 'ignore')# .encode(source_encoding)
		codecs.open(filename, 'w', encoding="UTF-8-SIG").write(content)

if __name__=="__main__":
	if len(sys.argv) >= 2:
		convertEncoding(sys.argv[1])

以上是关于python 转换文件编码格式的主要内容,如果未能解决你的问题,请参考以下文章

使用python转换编码格式

使用python转换编码格式

SourceInsight解决中乱码问题,python脚本批量实现文件的编码转换

SourceInsight解决中乱码问题,python脚本批量实现文件的编码转换

初识python: 字符编码转换

Python学习之路4 - 文件操作&编码转换