Python打开文件编码出现:无法找到编码问题

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python打开文件编码出现:无法找到编码问题相关的知识,希望对你有一定的参考价值。


有时候文件打开时出现类似以下问题:

python UnicodeDecodeError: gbk codec cant decode byte 0xff in position 0
  1. 终极方法
    使用二进制读取文件
with open(filepath, rb) as f:
data = f.read()
  1. 知道编码格式,指定编码格式
with open(filepath, r, encoding=utf-8) as f:
data = f.read()
  1. 知道编码格式,但是有些数据还是读取错误,进行忽略
with open(filepath, r, encoding=utf-8, errors=igore) as f:
data = f.read()

建议1:‘rb’模式不会将读取的字节转换为字符,所以我觉得方法一适用于大多数情况。

建议2:当你了解文本中字符串是什么类型时,使用方法二。(‘utf-8’,‘gbk’,‘latin-1’)

建议3:当不需要读取文本中其他编码格式的字符时,可以忽略格式错误的字符的读取,使用方法三。


以上是关于Python打开文件编码出现:无法找到编码问题的主要内容,如果未能解决你的问题,请参考以下文章

记事本修改txt文件编码为UTF-8

记事本修改txt文件编码为UTF-8

python-整理-vs2013新建文件编码

文件编码问题

python3读文件编码错误怎么办

Python中,关于读取文件编码解码的问题