如何将 csv 文件转换为可作为文本读取的列表列表? Python

Posted

技术标签:

【中文标题】如何将 csv 文件转换为可作为文本读取的列表列表? Python【英文标题】:How to convert a csv file into to a list of list that is readable as text? python 【发布时间】:2018-08-28 10:48:20 【问题描述】:

我有一个包含一列和 300,000 个单独文本行的 cvs 文件,我想将其转换为列表列表。这样我就得到了一个包含 300,000 个列表的列表,每个句子都可以作为字符串读取。

当我将 csv 作为 DataFrame 打开并将其转换为系列时,每个句子都被拆分为字母。

sentence = pd.read_csv("myfile.csv", encoding='utf-8') 
sentence = pd.Series([sentence])
sentence = sentence.tolist()

This gives:

[[('W', 'h', 'a', 't', ' ', 'i', 's', ' ', 't', 'h', 'e', ' ', 's', 't', 'e', 'p'

相反,我想要的是例如当我打印(句子)时,它会显示:

[['What is the step by step approach for building a house?'],['The
first step is securing an adequate plot.'] etc....]

有没有简单的方法来做到这一点?

【问题讨论】:

查找join()方法。 具体来说,就是newlist = ["".join(val) for val in sentence] 原始文件是什么样的?我不明白你为什么使用 csv 来读取文本行列表。 【参考方案1】:

既然只有一列,为什么不直接将其作为普通文本文件打开呢?

df = pd.DataFrame([line for line in open('myfile.csv', 'r')])

【讨论】:

【参考方案2】:

您可能可以跳过read_csv 并将文件作为文件读取。见:How do I read a file line-by-line into a list?

在你的情况下,你可以扔掉标题。

【讨论】:

以上是关于如何将 csv 文件转换为可作为文本读取的列表列表? Python的主要内容,如果未能解决你的问题,请参考以下文章

如何使用pandas将csv列作为dtype列表读取?

如何从csv文件中读取包含逗号的列表作为列?

如何将对象列表转换为 csv?

如何将 csv 文件转换为 python 中的列表列表

如何将文件作为列表/字典读取? [复制]

将列表写入 pandas 数据帧到 csv,从 csv 读取数据帧并再次转换为列表而无需字符串