KMP板子 KMP的小小理解

Posted 2020-10-26 KKKorange的代码盒子

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了KMP板子 KMP的小小理解相关的知识，希望对你有一定的参考价值。

KMP算法是一个字符串匹配算法，最直白的用法就是在一个长度为n的字符串T中查找另一个长度为m字符串P的匹配（总之就是用于文本中进行单个字符串的匹配）。

对于这个问题，暴力算法是很好做的，直接对于T的每个位置判断一下当前位置作为P的结尾是否可以匹配成功，算法复杂度是O(nm)。

KMP算法的主要思想是：假设现在正在用P的第j个字符和T的第i个字符进行匹配，如果成功就匹配下一个字符；如果失败的话就跳到以j-1个字符为结尾的后缀的最长相同前缀的结尾后一个位置进行匹配。为此要把P做成一个状态机（也就是失配函数），在上面根据情况进行转移。

复杂分析：每一次i增加的时候伴随着j的增加，i增加的时候为j提供了减少的空间，因此j最多会减少n次。加上预处理的时间，总时间复杂度O(n+m)。（这次一定要好好记住，之前看一次忘一次。。。）

下面给出上面问题的代码（n<=1000000,m<=10000）。

 1 #include<iostream>
 2 #include<cstdio>
 3 #include<cstring>
 4 #include<cstdlib>
 5 #include<algorithm>
 6 #include<cmath>
 7 #include<queue>
 8 #include<set>
 9 #include<map>
10 #include<vector>
11 #include<cctype>
12 using namespace std;
13 const int maxn=1000005;
14 const int maxm=10005;
15 
16 int N,f[maxn];
17 char P[maxm],T[maxn];
18 
19 void getfail(char *p)
20 {
21     f[0]=f[1]=0;
22     int m=strlen(p);
23     for(int i=1;i<m;i++){
24         int j=f[i];
25         while(j&&p[i]!=p[j]) j=f[j];
26         f[i+1]=p[i]==p[j]?j+1:0;
27     }
28 }
29 int find(char *t,char *p)
30 {
31     getfail(p);
32     int j=0,re=0,m=strlen(p),n=strlen(t);
33     for(int i=0;i<n;i++){
34         while(j&&t[i]!=p[j]) j=f[j];
35         if(t[i]==p[j]) j++;
36         if(j==m) re++,j=f[j];
37     }
38     return re;
39 }
40 int main()
41 {
42     scanf("%d\n",&N);
43     for(int i=1;i<=N;i++){
44         gets(P);gets(T);
45         printf("%d\n",find(T,P));
46     }
47     return 0;
48 }

以上是关于KMP板子 KMP的小小理解的主要内容，如果未能解决你的问题，请参考以下文章