逐行读取文件数据,分析每一行数据与目标字符串的相似度,Python

Posted zhangphil

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了逐行读取文件数据,分析每一行数据与目标字符串的相似度,Python相关的知识,希望对你有一定的参考价值。

一行一行的读取文件数据,分析每一行中数据与目标字符串的相似度,设置相似度阈值,把高相似度的行数据输出,Python实现。

简单的说,给定一个关键词,然后在一个文件中搜索包含这个关键词的以行为单位的数据。

from fuzzywuzzy import fuzz

FILE_PATH = r'c:\\data.json'
KEY = r'要寻找的关键词'
threshold = 0


if __name__ == '__main__':
    with open(FILE_PATH, 'r', encoding='UTF-8') as f:
        cnt = 1

        for line in f:
            pr = fuzz.partial_ratio(line, KEY)

            if pr > threshold:
                print('-----')
                s = '第number行,相似度ratio\\ncontent'

                ss = s.format(number=cnt, ratio=pr, content=line)
                print(ss)

            cnt = cnt + 1

    f.close()

以上是关于逐行读取文件数据,分析每一行数据与目标字符串的相似度,Python的主要内容,如果未能解决你的问题,请参考以下文章

在 bash 上逐行读取文件;每一行都包含另一个 unqiue 文件的路径

C++ 逐行读取文件,然后使用分隔符分割每一行

C++中怎么逐行读取数据

如何在 Java 中逐行读取文本文件并分隔每一行的内容?

python逐行读取txt文件 每行为一个list

如何逐行读取文本文件并使用android将每一行存储在数组中?可以在android中读取xls文件吗?