KMP 算法

Posted 2020-09-28 jzdwajue

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了KMP 算法相关的知识，希望对你有一定的参考价值。

文件夹

文件夹

1.题目描写叙述

题目来自于hihocoder：http://hihocoder.com/problemset/problem/1015

1015 : KMP算法

时间限制:1000ms
单点时限:1000ms
内存限制:256MB

描写叙述
小Hi和小Ho是一对好朋友。出生在信息化社会的他们对编程产生了莫大的兴趣，他们约定好互相帮助。在编程的学习道路上一同前进。

这一天。他们遇到了一仅仅河蟹。于是河蟹就向小Hi和小Ho提出了那个经典的问题：“小Hi和小Ho，你们能不可以推断一段文字（原串）里面是不是存在那么一些……特殊……的文字（模式串）？”

小Hi和小Ho细致思考了一下。认为仅仅能想到非常easy的做法。可是又认为既然河蟹先生这么说了，就肯定不会这么easy的让他们回答了。于是他们仅仅能说道：“抱歉，河蟹先生，我们仅仅能想到时间复杂度为（文本长度 * 特殊文字总长度）的方法，即对于每个模式串分开推断，然后依次枚举起始位置并检查是否可以匹配，可是这不是您想要的方法是吧？”

河蟹点了点头。说道：”看来你们的水平还有待提高。这样吧，假设我说仅仅有一个特殊文字，你能不能做到呢？“

小Ho这时候还有点晕晕乎乎的。可是小Hi非常快开口道：”我知道！这就是一个非常经典的模式匹配问题！可以使用KMP算法进行求解。“

河蟹惬意的点了点头。对小Hi说道：”既然你知道就好办了，你去把小Ho教会，下周我有重要的任务交给你们！“

”保证完毕任务！”小Hi点头道。

提示一：KMP的思路

提示二：NEXT数组的使用

提示三：怎样求解NEXT数组

输入
第一行一个整数N，表示測试数据组数。

接下来的N*2行，每两行表示一个測试数据。在每个測试数据中，第一行为模式串，由不超过10^4个大写字母组成，第二行为原串，由不超过10^6个大写字母组成。

当中N<=20

输出
对于每个測试数据。依照它们在输入中出现的顺序输出一行Ans。表示模式串在原串中出现的次数。

例子输入

5
HA
HAHAHA
WQN
WQN
ADA
ADADADA
BABABB
BABABABABABABABABB
DAD
ADDAADAADDAAADAAD

例子输出

2.算法核心

本题目求得是模式串在原串中出现的次数。

我们通过在模式串的最后一位加入一个特殊字符$当模式串走到最后一位时候退回到新的位置进行比較

3.代码

#include<iostream>
#include<vector>
#include<string>
using namespace std;
void NextArrayCal(string &str,vector<int> &next)
{
    int j=0,k=-1;
    next[0]=-1;
    while(j<str.size()-1)
    {
        if(k==-1||str[j]==str[k])
        {
            j++,k++;
            if(str[j]!=str[k])
                next[j]=k;
            else
                next[j]=next[k];
            next[j]=k;
        }
        else
            k=next[k];
    }
}
int KMPindex(string &str,string&pat)
{
    vector<int>next(pat.size());
    NextArrayCal(pat,next);
    int i=0,j=0;
    int res=0;
    int strsize=str.size(),patsize=pat.size();
    while(i<strsize)
    {

        if(j==-1||str[i]==pat[j])
        {
            i++;j++;

        }
        else{
            j=next[j];
        }
        if(j>=patsize-1)
        {
            ++res;
            j=next[patsize-1];

        }
    }

    return res;
}
int main()
{
    int tn;
    cin>>tn;
    string str;
    string pat;
    str.reserve(1000008);
    pat.reserve(10008);
    for(int ye=0;ye<tn;++ye)
    {
        cin>>pat;
        pat+="$";
        cin>>str;
        cout<< KMPindex(str,pat)<<endl;
    }
}

以上是关于KMP 算法的主要内容，如果未能解决你的问题，请参考以下文章