python的"ufeff"与中文编码问题

Posted codeDog123

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python的"ufeff"与中文编码问题相关的知识,希望对你有一定的参考价值。

python2要对中文做处理的话,文件头加上:

#coding=utf-8    python源代码文件的编码格式
import sys 
reload(sys) 
sys.setdefaultencoding(utf-8)     sys.defaultencoding设置解码方式,默认为ANSCII,有时候会报错

使用

f1 = open(file_chinese, encoding = UTF-8,errors="ignore")

读取的文件中有时候会出现"ufeff"非法字符,这个时候需要改变编码方式‘UTF-8‘为‘UTF-8-sig‘:

f1 = open(file_chinese, encoding = UTF-8-sig,errors="ignore")

"UTF-8"的字节顺序在所有系统中都是一様的,没有字节序的问题,它不需要BOM(“ByteOrder Mark”)。

"UTF-8-sig"即UTF-8 with BOM需要提供BOM。

以上是关于python的"ufeff"与中文编码问题的主要内容,如果未能解决你的问题,请参考以下文章

去除 ufeff——访问网址或读取文件莫名其妙无法读取错误——raise InvalidSchema("No connection adapters were found for '(

android studio 非法字符: 'ufeff' 解决方式

Python中读取文件输出时在头部输出ufeff

python读取文件,python读取的1变成ufeff1

Python读取文件,使用split进行分割时,出现ufeff

python 字符串转列表出现ufeff的解决方法