最长公共子序列+最长公共子串+编辑距离

Posted 钟钟终

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了最长公共子序列+最长公共子串+编辑距离相关的知识,希望对你有一定的参考价值。

最长公共子序列

利用二维数组f[i][j],表示a[1~i]和 b[1 ~j]的最长公共子序列的长度
边界条件:f[0][j]=0,f[i][0]=0
获取lcs的长度:

int n,m,f[1005][1005];
string s1,s2;
void lcs()

    n=s1.length();
    m=s2.length();
    for(int i=1;i<=n;i++)
    
        for(int j=1;j<=m;j++)
        
            if(s1[i-1]==s2[j-1])
                f[i][j]=f[i-1][j-1]+1;
            else 
                f[i][j]=max(f[i-1][j],f[i][j-1]);
        
    
    cout<<f[n][m]<<endl;

获取最长公共子序列的值:

int n,m,f[1005][1005],p[1005][1005];
string s1,s2;
void lcs()

    n=s1.length();
    m=s2.length();
    for(int i=1;i<=n;i++)
    
        for(int j=1;j<=m;j++)
        
            if(s1[i-1]==s2[j-1])
            
                f[i][j]=f[i-1][j-1]+1;
                p[i][j]=1;  //左上方
            
            else if(f[i][j-1]>f[i-1][j])
            
                f[i][j]=f[i][j-1];
                p[i][j]=2;  //左边
            
            else
            
                f[i][j]=f[i-1][j];
                p[i][j]=3;  //上边
            
        
    
    cout<<f[n][m]<<endl;

void get_lcs()

    char c[1005];
    i=n,j=m,k=f[n][m];
    while(i>0&&j>0)
    
        if(p[i][j]==1)
        
            s[k--]=a[i-1];i--,j--;
        
        else if(p[i][j]==2)
            j--;
        else 
            i--;
    

void solve()

    lcs();
    get_lcs();

最长公共子串

不同点在于子序列不必要连续,而子串必须要连续。
因此只有当两字符串中的字符连续相等时,公共子串的长度才会不断累加,否则清零。
状态变量:f[i][j]表示已a[i]和b[j]为结尾的公共子串的长度
代码:

#include<bits/stdc++.h>
#define int long long
#define endl '\\n'
#define For(i,a,b) for(i=(a);i<=(b);++i)
#define ios (ios::sync_with_stdio(false),cin.tie(0),cout.tie(0))
using namespace std;
const int N=1e6+7;
const int inf=0x3f3f3f3f;
const int mod=1e9+7;
int n,m,f[1005][1005],p[1005][1005];
string s1,s2;
void lcs()

    n=s1.length();
    m=s2.length();
    int mx=0;
    for(int i=1;i<=n;i++)
    
        for(int j=1;j<=m;j++)
        
            if(s1[i-1]==s2[j-1])
                f[i][j]=f[i-1][j-1]+1;
            else 
                f[i][j]=0;
            mx=max(mx,f[i][j]);
        
    
    cout<<mx<<endl;


void solve()

    lcs();

signed main()

    //ios;
    //int T;cin>>T;
    //while(T--)
        solve();
    return 0;



编辑距离

通过增删改操作使得两个字符串相等的最少操作次数
时间、空间复杂度:O(m*n)

#include<bits/stdc++.h>
#define int long long
#define endl '\\n'
#define For(i,a,b) for(i=(a);i<=(b);++i)
#define ios (ios::sync_with_stdio(false),cin.tie(0),cout.tie(0))
using namespace std;
const int N=1e6+7;
const int inf=0x3f3f3f3f;
const int mod=1e9+7;
int n,m,f[1005][1005],p[1005][1005];
string s1,s2;
void lcs()

    n=s1.length();
    m=s2.length();
    for(int i=1;i<=n;i++)   f[i][0]=i;
    for(int i=1;i<=m;i++)   f[0][i]=i;
    for(int i=1;i<=n;i++)
    
        for(int j=1;j<=m;j++)
        
            if(s1[i-1]==s2[j-1])
                f[i][j]=f[i-1][j-1];
            else 
                f[i][j]=min(f[i-1][j-1],f[i-1][j],f[i][j-1])+1;
                            //  修改      删除      插入
        
    
    cout<<f[n][m]<<endl;


void solve()

    lcs();

signed main()

    //ios;
    //int T;cin>>T;
    //while(T--)
        solve();
    return 0;



进行空间优化,利用滚动数组,将为O(n)(有点没听懂,先记录下):
https://www.bilibili.com/video/BV1gk4y1177j?spm_id_from=333.999.0.0&vd_source=91973ada1213cf6ba2cbb43a2bebd2e8

以上是关于最长公共子序列+最长公共子串+编辑距离的主要内容,如果未能解决你的问题,请参考以下文章

子序列与子串问题

子序列与子串问题

子序列与子串问题

算法 ---- 子序列系列问题题解(子序列编辑距离回文系列问题)

算法 ---- 子序列系列问题题解(子序列编辑距离回文系列问题)

算法 ---- 子序列系列问题题解(子序列编辑距离回文系列问题)