算法学习:后缀数组 height的求取

Posted rentu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了算法学习:后缀数组 height的求取相关的知识,希望对你有一定的参考价值。

【定义】

【LCP】全名最长公共前缀,两个后缀之间的最长前缀,以下我们定义

lcp ( i , j ) 的意义是后缀 i 和 j 的最长前缀

 

【z函数】 函数z [ i ] 表示的是,第 i 个后缀和字符串的最长前缀

 

 


 

技术图片

 【解决问题】

这两个算法都是在解决这个问题

即求后缀和字符串和后缀之间的最长公共前缀

 

但是有所不同的是,

后缀数组最终求出的是,字典序第 i 个后缀和第 i + 1 个后缀的最长公共前缀

z函数最终求出的是,第 i 个后缀和字符串的最长公共前缀

 

然后通过这个最长公共前缀求一些其他的值

 


 

【算法学习】

【后缀数组】

  后缀数组能够在 n 的时间内求出字典序第 i 和第 i - 1 个后缀的最长公共前缀

  而这个函数通常被命名为 height 

  height [ i ] 的含义为 , 字典序第 i - 1个后缀和第 i 个后缀的最长公共前缀

  有以下几个性质进行求取:(s [ i ] 表示第 i 个后缀)

  1.若 i 小于 j , LCP ( i , j )  = min LCP ( k - 1 , k ), i + 1 <= k <= j

  可利用此项用 RMQ 求LCP

  2.定义 h [ i ] 为 :第 i 号开始的后缀和他字典序前面的后缀的LCP

  即: h [ i ] = height [ rank [ i ] ]

  于是有,对于 i > 1 且 rank [ i ]  > 1 有  

   h [ i ]  >  h [ i - 1 ] - 1 ;

   

  证明如下 :

  设 j 为 第 i - 1 号开始的后缀按排名的前面的那个后缀的开始的位置

  注意: j 不是第 i - 2号

  此时,第 j 个后缀和第 i - 1 个后缀的 LCP 在定义上为 height [ rank [ i - 1 ] ],即 h [ i - 1 ]

  即我们要证明的右半部分的一部分

  然后我们讨论 j + 1 和 i (由得到 i - 1 + 1 ) 的关系:

  第一种,当 j 和 i - 1 首字母不相等的情况,h [ i - 1 ] 为 0

  那么显然  h [ i ] > h [ i - 1 ] - 1

  第二种,当 j 和 i - 1 首字母相等的情况,  

  那么显然,j 和 i - 1 的 LCP 为 h [ i - 1 ] - 1

  在后缀中,排名比 i 考前,和后缀 i LCP最长的,相似度最高的显然是SA中离他最近的那个

  即 SA [ rank [ i - 1] ]  - 1 

  也就是 , h [ i ] >= h [ i - 1 ] - 1

  证毕

  

  所以我们每次找最长前缀的时候,都可以从 h [ i - 1 ]  开始检索

  可以类比 manacher

  代码如下:

void GetHeight() 
    int j, k = 0;
    for(int i = 1; i <= N; i++) 
        if(k) k--;
        int j = sa[rak[i] - 1];
        while(s[i + k] == s[j + k]) k++;
        Height[rak[i]] = k;
        printf("%d\n", k);
    

 

 


 

题目:

 

【SDOI 2008】 Sandy的卡片

 

 

 

  

 

以上是关于算法学习:后缀数组 height的求取的主要内容,如果未能解决你的问题,请参考以下文章

后缀数组 poj 3415

后缀数组入门——Height数组与LCP

后缀数组之倍增算法

后缀数组模板

后缀数组模板及一些数组的含义

后缀数组总结