python基础===codecs打开文件,解决文件编码格式的问题
Posted botoo
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python基础===codecs打开文件,解决文件编码格式的问题相关的知识,希望对你有一定的参考价值。
codecs
https://docs.python.org/3/library/codecs.html
我们经常用open打开文件的时候会出现各式各样的错误,编码格式的问题,等等~真的很烦
现在尽量使用codecs的方式打开文件
txt文档是这样的,使用open()的方式,打开直接报错。
那么使用codecs的方式,如下:
import codecs f = codecs.open("123.txt","r","utf-8") words = f.read()
基本使用到现在没有出现错误!
为了获取id我们还需要使用正则匹配
import re import codecs f = codecs.open(r"78.txt","r","utf-8") words = f.read() p = re.compile(\' ID="(.*?)" IsException\', re.S) ids = re.findall(p , words) #ids这里是以list的形式储存 s = \'\\n\'.join(ids) #每一项都换行打印 print(s)
>>>
最终得到id
以上是关于python基础===codecs打开文件,解决文件编码格式的问题的主要内容,如果未能解决你的问题,请参考以下文章
解决Python2.7的UnicodeEncodeError: ‘ascii’ codec can’t encode异常错误
解决vs2013下创建的python文件,到其他平台(如linux)下中文乱码(或运行时报SyntaxError: (unicode error) 'utf-8' codec can&