如何编写 python 单行代码来创建文件中所有单词的列表? [复制]
Posted
技术标签:
【中文标题】如何编写 python 单行代码来创建文件中所有单词的列表? [复制]【英文标题】:how do I write a python one-liner to create a list of all words in a file? [duplicate] 【发布时间】:2021-12-31 04:56:29 【问题描述】:给定一个 ascii 文件,我想要一个 python one-liner 在文件中创建一个单词列表。
让 tfile 包含以下 2 行
abc xyz abc mno
tuv xyz qrs abc
文件中有 8 个单词和 5 个唯一单词。
如果我分配
file='tfile'
以下单行将创建一个包含 tfile 中 5 个唯一单词的集合
s=set(open(file).read().split())
输出是 'abc', 'mno', 'qrs', 'tuv', 'xyz'
但是,如果我尝试类似的方法来获取文件中所有单词的列表,即
l=list(open(file).read().split(" "))
我得到以下信息
['abc', 'xyz', 'abc', 'mno\ntuv', 'xyz', 'qrs', 'abc\n']
这不太有效,因为每行的最后一个单词都附加了一个换行符。
如果我将 strip() 添加到语句中
l=list(open(file).read().strip().split(" "))
我得到以下内容,这更好,但仍然包含一个换行符,该换行符附加到文件中下一行的第一个单词。
['abc', 'xyz', 'abc', 'mno', '\ntuv', 'xyz', 'qrs', 'abc']
所以 2 个问题: (1) 是否有一条线可以满足我的要求?和 (2) 为什么这组独特的单词可以很好地工作,没有任何换行符?
【问题讨论】:
在split(' ')
之前做.replace('\n', ' ' )
用空格替换换行符
您是否在split
中添加了一个参数却没有注意到,或者这是您试图理解和修改的其他人的代码?
【参考方案1】:
您已将" "
作为参数添加到第二个示例中的拆分。一开始,你有
s=set(open(file).read().split())
但是,你会的
l=list(open(file).read().split(" "))
密钥是split(" ")
。没有它,Python 只会在任何被认为是空白的地方进行拆分,但有了它,它就会被限制为空格。
所以你只需要
l=list(open(file).read().split())
【讨论】:
【参考方案2】:如果你想要一个唯一词的列表,你可以先创建一个集合,然后转换为一个列表。
l=list(set(open(file).read().split()))
【讨论】:
以上是关于如何编写 python 单行代码来创建文件中所有单词的列表? [复制]的主要内容,如果未能解决你的问题,请参考以下文章