逐行读取文件数据,分析每一行数据与目标字符串的相似度,Python
Posted zhangphil
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了逐行读取文件数据,分析每一行数据与目标字符串的相似度,Python相关的知识,希望对你有一定的参考价值。
一行一行的读取文件数据,分析每一行中数据与目标字符串的相似度,设置相似度阈值,把高相似度的行数据输出,Python实现。
简单的说,给定一个关键词,然后在一个文件中搜索包含这个关键词的以行为单位的数据。
from fuzzywuzzy import fuzz
FILE_PATH = r'c:\\data.json'
KEY = r'要寻找的关键词'
threshold = 0
if __name__ == '__main__':
with open(FILE_PATH, 'r', encoding='UTF-8') as f:
cnt = 1
for line in f:
pr = fuzz.partial_ratio(line, KEY)
if pr > threshold:
print('-----')
s = '第number行,相似度ratio\\ncontent'
ss = s.format(number=cnt, ratio=pr, content=line)
print(ss)
cnt = cnt + 1
f.close()
以上是关于逐行读取文件数据,分析每一行数据与目标字符串的相似度,Python的主要内容,如果未能解决你的问题,请参考以下文章