如何将 csv 文件转换为可作为文本读取的列表列表? Python
Posted
技术标签:
【中文标题】如何将 csv 文件转换为可作为文本读取的列表列表? Python【英文标题】:How to convert a csv file into to a list of list that is readable as text? python 【发布时间】:2018-08-28 10:48:20 【问题描述】:我有一个包含一列和 300,000 个单独文本行的 cvs 文件,我想将其转换为列表列表。这样我就得到了一个包含 300,000 个列表的列表,每个句子都可以作为字符串读取。
当我将 csv 作为 DataFrame 打开并将其转换为系列时,每个句子都被拆分为字母。
sentence = pd.read_csv("myfile.csv", encoding='utf-8')
sentence = pd.Series([sentence])
sentence = sentence.tolist()
This gives:
[[('W', 'h', 'a', 't', ' ', 'i', 's', ' ', 't', 'h', 'e', ' ', 's', 't', 'e', 'p'
相反,我想要的是例如当我打印(句子)时,它会显示:
[['What is the step by step approach for building a house?'],['The
first step is securing an adequate plot.'] etc....]
有没有简单的方法来做到这一点?
【问题讨论】:
查找join()
方法。
具体来说,就是newlist = ["".join(val) for val in sentence]
原始文件是什么样的?我不明白你为什么使用 csv 来读取文本行列表。
【参考方案1】:
既然只有一列,为什么不直接将其作为普通文本文件打开呢?
df = pd.DataFrame([line for line in open('myfile.csv', 'r')])
【讨论】:
【参考方案2】:您可能可以跳过read_csv
并将文件作为文件读取。见:How do I read a file line-by-line into a list?
在你的情况下,你可以扔掉标题。
【讨论】:
以上是关于如何将 csv 文件转换为可作为文本读取的列表列表? Python的主要内容,如果未能解决你的问题,请参考以下文章