KMP算法是一个字符串匹配算法,最直白的用法就是在一个长度为n的字符串T中查找另一个长度为m字符串P的匹配(总之就是用于文本中进行单个字符串的匹配)。
对于这个问题,暴力算法是很好做的,直接对于T的每个位置判断一下当前位置作为P的结尾是否可以匹配成功,算法复杂度是O(nm)。
KMP算法的主要思想是:假设现在正在用P的第j个字符和T的第i个字符进行匹配,如果成功就匹配下一个字符;如果失败的话就跳到 以j-1个字符为结尾的后缀的 最长相同前缀的结尾 后一个位置进行匹配。为此要把P做成一个状态机(也就是失配函数),在上面根据情况进行转移。
复杂分析:每一次i增加的时候伴随着j的增加,i增加的时候为j提供了减少的空间,因此j最多会减少n次。加上预处理的时间,总时间复杂度O(n+m)。(这次一定要好好记住,之前看一次忘一次。。。)
下面给出上面问题的代码(n<=1000000,m<=10000)。
1 #include<iostream> 2 #include<cstdio> 3 #include<cstring> 4 #include<cstdlib> 5 #include<algorithm> 6 #include<cmath> 7 #include<queue> 8 #include<set> 9 #include<map> 10 #include<vector> 11 #include<cctype> 12 using namespace std; 13 const int maxn=1000005; 14 const int maxm=10005; 15 16 int N,f[maxn]; 17 char P[maxm],T[maxn]; 18 19 void getfail(char *p) 20 { 21 f[0]=f[1]=0; 22 int m=strlen(p); 23 for(int i=1;i<m;i++){ 24 int j=f[i]; 25 while(j&&p[i]!=p[j]) j=f[j]; 26 f[i+1]=p[i]==p[j]?j+1:0; 27 } 28 } 29 int find(char *t,char *p) 30 { 31 getfail(p); 32 int j=0,re=0,m=strlen(p),n=strlen(t); 33 for(int i=0;i<n;i++){ 34 while(j&&t[i]!=p[j]) j=f[j]; 35 if(t[i]==p[j]) j++; 36 if(j==m) re++,j=f[j]; 37 } 38 return re; 39 } 40 int main() 41 { 42 scanf("%d\n",&N); 43 for(int i=1;i<=N;i++){ 44 gets(P);gets(T); 45 printf("%d\n",find(T,P)); 46 } 47 return 0; 48 }