KMP 算法

Posted jzdwajue

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了KMP 算法相关的知识,希望对你有一定的参考价值。

文件夹

1.题目描写叙述

题目来自于hihocoder:http://hihocoder.com/problemset/problem/1015


1015 : KMP算法


时间限制:1000ms
单点时限:1000ms
内存限制:256MB


描写叙述
小Hi和小Ho是一对好朋友。出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助。在编程的学习道路上一同前进。

这一天。他们遇到了一仅仅河蟹。于是河蟹就向小Hi和小Ho提出了那个经典的问题:“小Hi和小Ho,你们能不可以推断一段文字(原串)里面是不是存在那么一些……特殊……的文字(模式串)?”

小Hi和小Ho细致思考了一下。认为仅仅能想到非常easy的做法。可是又认为既然河蟹先生这么说了,就肯定不会这么easy的让他们回答了。于是他们仅仅能说道:“抱歉,河蟹先生,我们仅仅能想到时间复杂度为(文本长度 * 特殊文字总长度)的方法,即对于每个模式串分开推断,然后依次枚举起始位置并检查是否可以匹配,可是这不是您想要的方法是吧?”

河蟹点了点头。说道:”看来你们的水平还有待提高。这样吧,假设我说仅仅有一个特殊文字,你能不能做到呢?“

小Ho这时候还有点晕晕乎乎的。可是小Hi非常快开口道:”我知道!这就是一个非常经典的模式匹配问题!可以使用KMP算法进行求解。“

河蟹惬意的点了点头。对小Hi说道:”既然你知道就好办了,你去把小Ho教会,下周我有重要的任务交给你们!“

”保证完毕任务!”小Hi点头道。

提示一:KMP的思路

提示二:NEXT数组的使用

提示三:怎样求解NEXT数组


输入
第一行一个整数N,表示測试数据组数。

接下来的N*2行,每两行表示一个測试数据。在每个測试数据中,第一行为模式串,由不超过10^4个大写字母组成,第二行为原串,由不超过10^6个大写字母组成。

当中N<=20


输出
对于每个測试数据。依照它们在输入中出现的顺序输出一行Ans。表示模式串在原串中出现的次数。


例子输入

5
HA
HAHAHA
WQN
WQN
ADA
ADADADA
BABABB
BABABABABABABABABB
DAD
ADDAADAADDAAADAAD

例子输出

3
1
3
1
0

2.算法核心

本题目求得是模式串在原串中出现的次数。

我们通过在模式串的最后一位加入一个特殊字符$当模式串走到最后一位时候退回到新的位置进行比較

3.代码

#include<iostream>
#include<vector>
#include<string>
using namespace std;
void NextArrayCal(string &str,vector<int> &next)
{
    int j=0,k=-1;
    next[0]=-1;
    while(j<str.size()-1)
    {
        if(k==-1||str[j]==str[k])
        {
            j++,k++;
            if(str[j]!=str[k])
                next[j]=k;
            else
                next[j]=next[k];
            next[j]=k;
        }
        else
            k=next[k];
    }
}
int KMPindex(string &str,string&pat)
{
    vector<int>next(pat.size());
    NextArrayCal(pat,next);
    int i=0,j=0;
    int res=0;
    int strsize=str.size(),patsize=pat.size();
    while(i<strsize)
    {

        if(j==-1||str[i]==pat[j])
        {
            i++;j++;

        }
        else{
            j=next[j];
        }
        if(j>=patsize-1)
        {
            ++res;
            j=next[patsize-1];

        }
    }

    return res;
}
int main()
{
    int tn;
    cin>>tn;
    string str;
    string pat;
    str.reserve(1000008);
    pat.reserve(10008);
    for(int ye=0;ye<tn;++ye)
    {
        cin>>pat;
        pat+="$";
        cin>>str;
        cout<< KMPindex(str,pat)<<endl;
    }
}

以上是关于KMP 算法的主要内容,如果未能解决你的问题,请参考以下文章

数据结构—串KMP模式匹配算法

Python ---- KMP(博文推荐+代码)

KMP算法及Python代码

KMP算法及Python代码

图解KMP算法原理及其代码分析

Kmp算法Java代码实现