如何从python中的文本文件中获取所有3克?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何从python中的文本文件中获取所有3克?相关的知识,希望对你有一定的参考价值。

我从文本文件中获取了一行,结果它生成了3克的一行,但在行尾,它的输出是2克。例如输入行是cswisceduwwt输出是

csw
swi
wis
isc
sce
ced
edu
dup
upa
par
ara
rad
ady
dyn
yn

在行尾,它生成2克(2个字符)。最后一个克是“yn”,我认为它增加了空间。我不需要“yn”如何删除每行中包含2个字符的最后一个字符?代码如下

def extract_n_grams(line):
        ngram = ngrams(line, 3)
        for item in ngram:
           result=item[0]+item[1]+item[2]
           print(result)

with open('C:/Users/Dania/Desktop/MS 2nd sem/preprocessed.txt') as corpus:
    for line in corpus:
        extract_n_grams(line)
答案

它显示了最后两个字符,因为它包含空格作为其最后一个(第三个)字符所以我通过使用此语句删除了行尾的空格

for line in corpus:
        rem_line=line.rstrip('
')  #####removes space at the end of line
        extract_n_grams(rem_line)

以上是关于如何从python中的文本文件中获取所有3克?的主要内容,如果未能解决你的问题,请参考以下文章

从文本文件中读取句子并使用 Python 3 附加到列表中 [关闭]

在C++中如何读取文本中的数据存储为数组变量?

如何使用 Python 代码从 kv 文件中的 TextField 获取数据?

从巨大的文本中提取 n 克

如何从python中的文本文件中获取子字符串?

使用 web 驱动程序从 python 中的源页面获取所有文本