python中------decode解码出现的0xca问题解决方法

Posted 公子东

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python中------decode解码出现的0xca问题解决方法相关的知识,希望对你有一定的参考价值。

一。错误:

解决方法:

#源代码
data = sk.recv(1024)
print(str(data,\'gbk\'))


#修改代码
data = sk.recv(1024)
print(str(data,\'gbk\',‘ignore’))

二。常见错误整理

 

0x00 问题引出:
  result = res.decode(\'utf-8\')
  #当执行该语句的时候,会造成异常:
  UnicodeDecodeError:
\'utf-8\' codec can\'t decode byte 0xe5 in position 103339: invalid continuation byte

 

0x01 问题分析

 

该情况是由于出现了无法进行转换的 二进制数据 造成的,可以写一个小的脚本来判断下,是整体的字符集参数选择上出现了问题,还是出现了部分的无法转换的二进制块:

#python3
#以读入文件为例:
f = open("data.txt","rb")#二进制格式读文件
while True:
    line = f.readline()
    if not line:
        break
    else:
        try:
            #print(line.decode(\'utf8\'))
            line.decode(\'utf8\')
            #为了暴露出错误,最好此处不print
        except:
            print(str(line))

 

0x03 解决方法

 

修改字符集参数,一般这种情况出现得较多是在国标码(GBK)和utf8之间选择出现了问题。
出现异常报错是由于设置了decode()方法的第二个参数errors为严格(strict)形式造成的,因为默认就是这个参数,将其更改为ignore等即可。例如:

line.decode("utf8","ignore")

 

以上是关于python中------decode解码出现的0xca问题解决方法的主要内容,如果未能解决你的问题,请参考以下文章

Python—编码与解码(encode()和decode())

python中编码和解码decode和encode的使用

Python中编码encode()与解码decode()

python 编码(encode)解码(decode)问题

Python 进阶 — 字符串编码(encode)与解码(decode)

Python字符串的编码与解码(encode与decode)