AC自动机

Posted guaguastandup

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了AC自动机相关的知识,希望对你有一定的参考价值。

AC自动机

模板

找到有多少个匹配的

#include<bits/stdc++.h>
using namespace std;
const int maxn = 1e6 + 100;
const int cc = 26;
#define ms(a,b) memset(a,b,sizeof(a))
struct ACAM{
    int ch[maxn][cc], fail[maxn];
    int end[maxn], idx[maxn];
    int tot;
    void init() {
        ms(ch, 0), ms(end, 0), ms(fail, 0);
        tot = 0;
    }
    void insert(char *s) {
        int u = 0;
        for (int i = 0; s[i];i++) {
            int v = s[i]-‘a‘;
            if(!ch[u][v]) {
                ch[u][v] = ++tot;
            }
            u = ch[u][v];
        }
        end[u]++;
    }

    queue<int> q;
    void build(){
        for (int i = 0; i < cc; i++) {
            if (ch[0][i])
                q.push(ch[0][i]);
        }
        while (!q.empty()) {
            int u = q.front();
            q.pop();
            for (int v = 0; v < cc;v++) {
                if(ch[u][v]) {
                    fail[ch[u][v]] = ch[fail[u]][v];
                    q.push(ch[u][v]);
                }
                else
                    ch[u][v] = ch[fail[u]][v];
            }
        }
    }

    int query(char *t) {
        int u = 0, res = 0;
        for (int i = 0; t[i];i++) {
            int v = t[i] - ‘a‘;
            u = ch[u][v];
            for (int j = u; j && end[j] != -1;j = fail[j]) {
                res += end[j], end[j] = -1;
            }
        }
        return res;
    }
} ac;
char s[maxn];
char t[maxn];
int main() {
    int n;
    while(~scanf("%d", &n)) {
        for (int i = 1; i <= n;i++) {
            scanf("%s", s);
            ac.insert(s);
        }
        ac.build();
        scanf("%s", t);
        cout << ac.query(t) << endl;
    }
}

找到匹配次数最多的模板串

https://www.luogu.com.cn/problem/P3796

#include<bits/stdc++.h>
using namespace std;
const int maxn = 155 * 75;
const int cc = 26;
#define ms(a,b) memset(a,b,sizeof(a))
struct AC{
    int ch[maxn][cc], fail[maxn];
    int idx[maxn], val[maxn], cnt[maxn];
    int tot;
    void init() {
        ms(ch, 0), ms(fail, 0);
        ms(idx, 0), ms(val, 0), ms(cnt, 0);
        tot = 0;
    }
    void insert(char *s,int id) {
        int u = 0;
        for (int i = 0; s[i]; i++) {
            int v = s[i]-‘a‘;
            if(!ch[u][v]) {
                ch[u][v] = ++tot;
            }
            u = ch[u][v];
        }
        idx[id] = u;//如果有重复字符串,并不影响答案
    }

    queue<int> q;
    void build(){
        for (int i = 0; i < 26; i++) {
            if (ch[0][i])
                q.push(ch[0][i]);
        }
        while (q.size()) {
            int u = q.front();
            q.pop();
            for (int v = 0; v < 26;v++) {
                if(ch[u][v]) {
                    fail[ch[u][v]] = ch[fail[u]][v];
                    q.push(ch[u][v]);
                }
                else
                    ch[u][v] = ch[fail[u]][v];
            }
        }
    }

    int query(char *t) { //返回出现的最大次数
        int u = 0, res = 0;
        for (int i = 0; t[i];i++) {
            int v = t[i] - ‘a‘;
            u = ch[u][v];
            for (int j = u; j;j = fail[j]) {
                val[j]++;
            }
        }
        for (int i = 0; i <= tot; i++) {
            if (idx[i]) {
                res = max(res, val[i]);
                cnt[idx[i]] = val[i];
            }
        }
        return res;
    }
} ac;
char s[200][100];
char t[1000005];
int main() {
    int n;
    while(~scanf("%d", &n)&&n!=0) {
        ac.init();
        for (int i = 1; i <= n;i++) {
            scanf("%s", s[i]);
            ac.insert(s[i], i);
        }
        ac.build();
        scanf("%s", t);
        int mx = ac.query(t);
        printf("%d
", mx);
        for(int i=1;i<=n;i++) {
            if(ac.cnt[i]==mx) {
                printf("%s
", s[i]);
            }
        }
    }
}

输出每个模式串在文本串中出现的次数

#include<bits/stdc++.h>
using namespace std;
const int maxn = 2e5 + 10;
const int cc = 26;
#define ms(a,b) memset(a,b,sizeof(a))
struct AC{
    int ch[maxn][cc], fail[maxn];
    int idx[maxn], siz[maxn];
    int tot;
    void init() {
        ms(ch, 0), ms(fail, 0);
        ms(idx, 0), ms(siz, 0);
        tot = 0;
    }
    void insert(char *s,int id) {
        int u = 0;
        for (int i = 0; s[i]; i++) {
            int v = s[i]-‘a‘;
            if(!ch[u][v]) {
                ch[u][v] = ++tot;
            }
            u = ch[u][v];
        }
        idx[id] = u;//将第id个模式串对应的节点标记出来(可以重复)
    }

    queue<int> q;
    void build(){
        for (int i = 0; i < 26; i++) {
            if (ch[0][i])
                q.push(ch[0][i]);
        }
        while (q.size()) {
            int u = q.front();
            q.pop();
            for (int v = 0; v < 26;v++) {
                if(ch[u][v]) {
                    fail[ch[u][v]] = ch[fail[u]][v];
                    q.push(ch[u][v]);
                }
                else
                    ch[u][v] = ch[fail[u]][v];
            }
        }
    }

    vector<int> e[maxn];
    void dfs(int u) {
        for(int v:e[u]) {
            dfs(v);
            siz[u] += siz[v];
        }
    }
    void query(char *t) { //计算每个模式串出现的次数
        int u = 0, res = 0;
        for (int i = 0; i <= tot; i++) e[i].clear();
        for (int i = 0; t[i];i++) {
            int v = t[i] - ‘a‘;
            u = ch[u][v];
            siz[u]++;
        }
        for(int i=1;i<=tot;i++) {
            e[fail[i]].push_back(i);//建fail树
        }
        dfs(0);
    }
} ac;
char s[maxn];
char t[2000005];
int main() {
    int n;
    scanf("%d", &n);
    for (int i = 1; i <= n; i++) {
        scanf("%s", s);
        ac.insert(s, i);
    }
    ac.build();
    scanf("%s", t);
    ac.query(t);
    for (int i = 1; i <= n; i++) {
        printf("%d
", ac.siz[ac.idx[i]]);
    }
}

例题

小明系列故事-女友的考验

题意

从1号点走到n号点,路径只能按照升序

给定m条限制,这m条路径是不可以走的

请问从1到n的最短路径是什么

思路

在Tire图中,每一个结点代表一个前缀

把不可以走的路径放到Tire图里面,这样每个结点代表一个状态,如果那个状态被标记,则代表不可以走,这样在最短路的时候就不可以算这个点

(dp[i][j])表示在第i个点,状态是j

具体看代码

代码 : http://xlorpaste.cn/knri9b

注意

end[u] |= end[fail[u]];//把危险节点都标记上

以上是关于AC自动机的主要内容,如果未能解决你的问题,请参考以下文章

POJ3691DNA repair(AC自动机,DP)

HDU4057 Rescue the Rabbit(AC自动机+状压DP)

Codeforces 86C Genetic engineering(AC自动机+DP)

POJ1699 Best Sequence(AC自动机+状压DP)

POJ - 2778 ~ HDU - 2243 AC自动机+矩阵快速幂

HDU2457 DNA repair(AC自动机+DP)