自然语言处理之LCS最长公共子子序列

Posted students

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了自然语言处理之LCS最长公共子子序列相关的知识,希望对你有一定的参考价值。

#!一个序列S任意删除若干个字符得到的新序列T,则T叫做S的子序列

注意,这个和最长公共字串不一样,最长公共子串要求连续。

1.算法公式:

技术分享图片

def lcs(a,b):
    lena = len(a)
    lenb = len(b)
    c=[[0]*(lenb+1) for j in range(lena+1) ]
    flag = [[0]*(lenb+1) for j in range(lena+1) ]
    for i in range(lena+1)[1:]:
        for j in range (lenb+1)[1:]:
            if a[i-1]==b[j-1]:
                c[i][j]=c[i-1][j-1]+1
                flag[i][j]=ok
            elif c[i-1][j]>c[i][j-1]:
                c[i][j]=c[i-1][j]
                flag[i][j]=left
            else:
                c[i][j]=c[i][j-1]

    return c

a=lcs("ABCDEF","DBAFCDF")
print(a[-1][-1])

这里只是返回最大长度,如果求最大子序列,还需要进行回溯。

以上是关于自然语言处理之LCS最长公共子子序列的主要内容,如果未能解决你的问题,请参考以下文章

刷题之最长公共/上升子序列问题

动态规划之最长公共子序列(LCS)

Dynamic Programming(DP)之LCS(Longest Common Subsequence)/最长公共子序列

LCS(最长公共子序列)

最长公共子序列(LCS),求LCS长度和打印输出LCS

最长公共子序列lcs