自然语言处理词编辑距离计算

Posted betterthanever_victor

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了自然语言处理词编辑距离计算相关的知识,希望对你有一定的参考价值。

#自然语言处理词纠错,编辑距离计算,DP算法
def edit_distance(s,p):
    if len(s)==0:return len(p)
    if len(p)==0:return len(s)
    dp=[[0 for i in range(len(p)+1)] for j in range(len(s)+1)]
    
    for i in range(len(s)):
        dp[i][len(p)]=len(s)-i
    for j in range(len(p)):
        dp[len(s)][j]=len(p)-j
    dp[len(s)][len(p)]=0
    for i in range(len(s)-1,-1,-1):
        for j in range(len(p)-1,-1,-1):
            if s[i]==p[j]:
                dp[i][j]=dp[i+1][j+1]
            else:
                dp[i][j] =1+min(dp[i+1][j+1],dp[i][j+1],dp[i+1][j])
    return dp[0][0]
print(edit_distance(‘apdp‘,‘app‘))

  

以上是关于自然语言处理词编辑距离计算的主要内容,如果未能解决你的问题,请参考以下文章

编辑距离的应用

nlp自然语言处理中句子相似度计算

文本相似度计算(一):距离方法

NLPN-Gram自然语言处理模糊匹配编辑距离

ElasticSearch的match fuzzy查询参数详解

如何通过词向量技术来计算2个文档的相似度?