Trie 字典树

Posted mrmrwjk

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Trie 字典树相关的知识,希望对你有一定的参考价值。

Trie:高校地存储和查找字符串

集合的数据结构

如果要存储下面的单词 abcdef abdef aced bcdf bcff cdaa bcdc

星号表示存储的单词末尾标记,例如如果要查找aced 由于d的位置有星号,表名有该单词,如果查找abcf则没该单词,如果查找abcd由于d的位置没有星号,那么说明不存在该星号

image-20210521170545928

例题:Trie字符串统计

维护一个字符串集合,支持两种操作:

  1. I x 向集合中插入一个字符串 x;
  2. Q x 询问一个字符串在集合中出现了多少次。

共有 N 个操作,输入的字符串总长度不超过 105,字符串仅包含小写英文字母。

输入格式

第一行包含整数 N,表示操作数。

接下来 N 行,每行包含一个操作指令,指令为 I xQ x 中的一种。

输出格式

对于每个询问指令 Q x,都要输出一个整数作为结果,表示 x 在集合中出现的次数。

每个结果占一行。

数据范围

1≤N≤2∗104

输入样例:

5
I abc
Q abc
Q ab
I ab
Q ab

输出样例:

1
0
1

代码:

#include<iostream>

using namespace std;

const int N = 100010;

//son用于保存每个点的所有儿子(子节点),cnt表示以当前这个点结尾的单词有多少个
int son[N][26], cnt[N], idx; //下标是0的点,即是根结点,又是空节点

char str[N];

void insert(char str[]) {
    int p = 0;
    for (int i = 0; str[i]; i++) {
        int u = str[i] - \'a\';
        if (!son[p][u]) {
            son[p][u] = ++idx;
        }
        p = son[p][u];
       // cout<<"p--->"<<p<<endl;
    }
    cnt[p]++;
}

int query(char str[]) {
    int p = 0;
    for (int i = 0; str[i]; i++) {
        int u = str[i] - \'a\';
        if (!son[p][u]) {
            return 0;
        }
        p = son[p][u];
    }
    return cnt[p];
}

int main() {
    int n;
    scanf("%d", &n);
    while (n--) {
        char op[2];
        scanf("%s%s", op, str);
        if (op[0] == \'I\') {
            insert(str);
        } else {
            printf("%d\\n", query(str));
        }
    }


}

下面为测试数据,son数组的保存数据情况

可以理解:

在son数组中第一行表示根结点的孩子,不为0的位置表示有一个孩子

第二行表示a字母的孩子,有几个不为0的位置表示有几个孩子

第三行是b的孩子,根据输入数据abc abe 由于b后面会出现e c所有,会有两个位置不为0

image-20210522173531871

image-20210522173802952

以上是关于Trie 字典树的主要内容,如果未能解决你的问题,请参考以下文章

trie树(字典树)

前缀树(字典树/Trie) -----Java实现

01字典树

数据结构——trie树(字典树)

LeetCode 208. 实现 Trie (前缀树)

Trie树(字典树)