情感分析必备python文件读写:codecs
Posted HuaBro
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了情感分析必备python文件读写:codecs相关的知识,希望对你有一定的参考价值。
codecs在读取文件时,发生错误:
UnicodeDecodeError: \'utf-8\' codec can\'t decode byte 0xbe in position 0: invalid start byte
中文切换编码:gbk,正常解决。
但有时,utf-8和gbk都不好使用,使用notepad++,打开有乱码;看到有小块黑色。
这时候,需要加个参数, errors="ignore"
# 读文件:含特殊字符 import codecs f = codecs.open(\'20.txt\', \'rb\',encoding=\'gbk\', errors="ignore") # 默认编码utf-8,中文是gbk content = f.readline() f.close() print(\'in:\',content)
参考网站:https://www.cnblogs.com/always-fight/p/10304806.html
以上是关于情感分析必备python文件读写:codecs的主要内容,如果未能解决你的问题,请参考以下文章
AipNlp情感分析报错UnicodeEncodeError:‘gbk’ codec can‘t encode... :illegal multibyte sequence详解
python2.7应用codecs模块处理包含中文的读写问题