双数组Trie树中叶子结点check[t]=t的证明

Posted 2020-10-27 hapjin

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了双数组Trie树中叶子结点check[t]=t的证明相关的知识，希望对你有一定的参考价值。

双数组Trie树，其实就是用两个一维数组来表示Trie树这种数据结构。

一个数组称为BASE，另一个数组为CHECK。转移条件如下：

对于状态s，接收字符c，转移到状态t

BASE[s]+c=t
CHECK[t]=BASE[s]

对于根结点，定义：

根结点的状态为0，\\(t_根=0\\)

根结点的基地址为1，放在BASE数组下标为0处保存，故\\(BASE[t_根]=BASE[0]=1\\)。

\\(CHECK[t_根]=CHECK[0]=0\\)

对于Trie树中的一个结点nodeA，有如下信息：

字符\'A\'，这是给人看的
字符\'A\'的状态，用\\(t_A\\)来表示，\\(t_A\\)是一个整数。从根结点，经过条件 \'A\' 转移到nodeA，即：\\(BASE[0]+code(A)=t_A=1+65=66\\)，其中code(A)一般为该字符的ASCII码。
字符\'A\'的基地址，使用BASE数组来保存
由于字符\'A\'对应的结点nodeA的前驱是根结点，即\\(CHECK[t_A]=BASE[0]=1\\)

对于叶子结点node_leaf，定义该叶子结点的基地址为begin，code(node_leaf)=0，对于状态为t_leaf：

现在来证明：CHECK[t_leaf]=t_leaf

其中，第1、2点就是由转移条件，证明完毕。

另外，在Hancks的这篇文章中，有如下引用：

3、然后将这群兄弟节点的check设为check[begin + a1…an] = begin;很显然，叶子节点i的check[i]的值一定等于i，因为它是兄弟节点中的第一个，并且它的code为0。

就好理解了。
另外，对于叶子结点而言，BASE[t_leaf]=-index，参考，其中 -index 表示：该叶子结点所代表的关键词在词典中顺序。（当构造双数组树时，词典先加载到TreeMap中，是有序的）

以上是关于双数组Trie树中叶子结点check[t]=t的证明的主要内容，如果未能解决你的问题，请参考以下文章