从文件中读取每一行以在 Python 中列出 [重复]

Posted

技术标签:

【中文标题】从文件中读取每一行以在 Python 中列出 [重复]【英文标题】:Reading from file each line to list in Python [duplicate] 【发布时间】:2018-02-05 03:13:25 【问题描述】:

这是我的代码:

with open(path) as file:
    lines = file.readlines()
    print lines[0:5]

但是我得到了很多额外的字符,例如:

['cat2\xc2\xa0\xc2\xa0 2\xc2\xa0 0', 'cat1\xc2\xa00.5\xc2\xa0 0', 'cat2\xc2\xa0\xc2\xa0 1\xc2\xa0 0', 'cat1\xc2\xa0\xc2\xa0 0\xc2\xa0 0', 'cat2\xc2\xa0\xc2\xa0 0\xc2\xa0 3']

为什么我会得到它们?

原来的文本文件是这样的:

cat2   2  0
cat1 0.5  0
cat2   1  0
cat1   0  0
cat2   0  3

【问题讨论】:

您的文件中似乎有奇怪的字符... 对于任何试图重新打开此问题的人:解决此问题的所有要素都在链接的副本中。 【参考方案1】:

\xc2\xa0 是一个non-breaking space。将其替换为文件中的常规空格。

这个序列出现在许多编码中,包括UTF-8

在Wikipedia上查看更多信息

【讨论】:

你能补充一下这些字符是用什么格式找到的吗?

以上是关于从文件中读取每一行以在 Python 中列出 [重复]的主要内容,如果未能解决你的问题,请参考以下文章

python读取指定目录中所有文本文件的第一行,并以此为该文本文件名重命名

【python】批量读取txt,并在文件开头和每一行末尾添加字符串

python读取一个文件的每一行判断是否为素数,并把结果写到另一个文件中

提取 csv 文件特定列以在 Python 中列出

python读取word每一行

文档查看命令:catmorelessheadtail