从文件中读取每一行以在 Python 中列出 [重复]
Posted
技术标签:
【中文标题】从文件中读取每一行以在 Python 中列出 [重复]【英文标题】:Reading from file each line to list in Python [duplicate] 【发布时间】:2018-02-05 03:13:25 【问题描述】:这是我的代码:
with open(path) as file:
lines = file.readlines()
print lines[0:5]
但是我得到了很多额外的字符,例如:
['cat2\xc2\xa0\xc2\xa0 2\xc2\xa0 0', 'cat1\xc2\xa00.5\xc2\xa0 0', 'cat2\xc2\xa0\xc2\xa0 1\xc2\xa0 0', 'cat1\xc2\xa0\xc2\xa0 0\xc2\xa0 0', 'cat2\xc2\xa0\xc2\xa0 0\xc2\xa0 3']
为什么我会得到它们?
原来的文本文件是这样的:
cat2 2 0
cat1 0.5 0
cat2 1 0
cat1 0 0
cat2 0 3
【问题讨论】:
您的文件中似乎有奇怪的字符... 对于任何试图重新打开此问题的人:解决此问题的所有要素都在链接的副本中。 【参考方案1】:\xc2\xa0
是一个non-breaking space
。将其替换为文件中的常规空格。
这个序列出现在许多编码中,包括UTF-8
。
在Wikipedia上查看更多信息
【讨论】:
你能补充一下这些字符是用什么格式找到的吗?以上是关于从文件中读取每一行以在 Python 中列出 [重复]的主要内容,如果未能解决你的问题,请参考以下文章
python读取指定目录中所有文本文件的第一行,并以此为该文本文件名重命名
【python】批量读取txt,并在文件开头和每一行末尾添加字符串