情感分析必备python文件读写:codecs

Posted HuaBro

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了情感分析必备python文件读写:codecs相关的知识,希望对你有一定的参考价值。

codecs在读取文件时,发生错误:

UnicodeDecodeError: \'utf-8\' codec can\'t decode byte 0xbe in position 0: invalid start byte

中文切换编码:gbk,正常解决。

 

 

 但有时,utf-8和gbk都不好使用,使用notepad++,打开有乱码;看到有小块黑色。



这时候,需要加个参数, errors="ignore"

 

# 读文件:含特殊字符
import codecs
f = codecs.open(\'20.txt\', \'rb\',encoding=\'gbk\', errors="ignore")
# 默认编码utf-8,中文是gbk
content = f.readline()
f.close()
print(\'in:\',content)

 

 

 

 

 参考网站:https://www.cnblogs.com/always-fight/p/10304806.html

 

以上是关于情感分析必备python文件读写:codecs的主要内容,如果未能解决你的问题,请参考以下文章

AipNlp情感分析报错UnicodeEncodeError:‘gbk’ codec can‘t encode... :illegal multibyte sequence详解

python2.7应用codecs模块处理包含中文的读写问题

python2.7应用codecs模块处理包含中文的读写问题

Python中的情感分析代码使用了啥算法?

如何使用codecs模块将unicode数据娉蒰bk格式

python2下向文件写入unicode编码的内容,codecs包