字典树

Posted wuruofeng

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了字典树相关的知识,希望对你有一定的参考价值。

http://hihocoder.com/problemset/problem/1014

小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进。

这一天,他们遇到了一本词典,于是小Hi就向小Ho提出了那个经典的问题:“小Ho,你能不能对于每一个我给出的字符串,都在这个词典里面找到以这个字符串开头的所有单词呢?”

身经百战的小Ho答道:“怎么会不能呢!你每给我一个字符串,我就依次遍历词典里的所有单词,检查你给我的字符串是不是这个单词的前缀不就是了?”

小Hi笑道:“你啊,还是太年轻了!~假设这本词典里有10万个单词,我询问你一万次,你得要算到哪年哪月去?”

小Ho低头算了一算,看着那一堆堆的0,顿时感觉自己这辈子都要花在上面了...

小Hi看着小Ho的囧样,也是继续笑道:“让我来提高一下你的知识水平吧~你知道树这样一种数据结构么?”

小Ho想了想,说道:“知道~它是一种基础的数据结构,就像这里说的一样!”

小Hi满意的点了点头,说道:“那你知道我怎么样用一棵树来表示整个词典么?”

小Ho摇摇头表示自己不清楚。

提示一:Trie树的建立

“你看,我们现在得到了这样一棵树,那么你看,如果我给你一个字符串ap,你要怎么找到所有以ap开头的单词呢?”小Hi又开始考校小Ho。

“唔...一个个遍历所有的单词?”小Ho还是不忘自己最开始提出来的算法。

“笨!这棵树难道就白构建了!”小Hi教训完小Ho,继续道:“看好了!”

提示二:如何使用Trie树

提示三:在建立Trie树时同时进行统计!

“那么现在!赶紧去用代码实现吧!”小Hi如是说道

输入

输入的第一行为一个正整数n,表示词典的大小,其后n行,每一行一个单词(不保证是英文单词,也有可能是火星文单词哦),单词由不超过10个的小写英文字母组成,可能存在相同的单词,此时应将其视作不同的单词。接下来的一行为一个正整数m,表示小Hi询问的次数,其后m行,每一行一个字符串,该字符串由不超过10个的小写英文字母组成,表示小Hi的一个询问。

在20%的数据中n, m<=10,词典的字母表大小<=2.

在60%的数据中n, m<=1000,词典的字母表大小<=5.

在100%的数据中n, m<=100000,词典的字母表大小<=26.

本题按通过的数据量排名哦~

输出

对于小Hi的每一个询问,输出一个整数Ans,表示词典中以小Hi给出的字符串为前缀的单词的个数。

样例输入

5
babaab
babbbaaaa
abba
aaaaabaa
babaababb
5
babb
baabaaa
bab
bb
bbabbaab

样例输出

1
0
3
0
0



 1 #include <iostream>
 2 #include <string>
 3 
 4 using namespace std;
 5 struct Tire{
 6     int num;
 7     Tire* next[26];
 8     Tire(){
 9         num=0;
10         for(int i=0;i<25;i++){
11             next[i]=NULL;
12         }
13     }    
14 }tree;
15 
16 void Insert(char* word){
17     Tire *p=&tree; //p 是一个指针
18     for(int i=0;word[i];i++){
19         int j=word[i]-a;
20         if(p->next[j]==NULL)
21             p->next[j]=new Tire();
22             p=p->next[j];
23             p->num++;
24     }    
25     
26 }
27 int Find(char* word){
28     Tire *p=&tree; //p 是一个指针
29     for(int i=0;word[i];i++){
30         int j=word[i]-a;
31         if(p->next[j]==NULL)
32             return 0;
33             p=p->next[j];        
34     }    
35     return p->num;
36 
37 }
38 
39 int main(int argc, char *argv[]) {
40     //freopen("in.txt","r",stdin);
41     int n;
42     char x[11];
43     cin>>n;
44     while(n--){
45         scanf("%s",x);
46         Insert(x);
47     }
48     int k;
49     cin>>k;
50     while(k--){
51         scanf("%s",x);
52         cout<<Find(x)<<endl;
53     }
54 }

树的每一层大概是26的i次方,属于牺牲空间换时间的算法。

 

以上是关于字典树的主要内容,如果未能解决你的问题,请参考以下文章

字典树(java)

字典树(java)

Python代码阅读(第19篇):合并多个字典

统计难题HDU - 1251map打表或字典树字典树模板

Python代码阅读(第26篇):将列表映射成字典

字典树——入门学习(java代码实现)