后缀数组模板

Posted Pat

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了后缀数组模板相关的知识,希望对你有一定的参考价值。

罗穗骞论文《后缀数组--处理字符串的有力工具》中的实现修改后的版本。

void SA(char *s, int *sa, int *sa2, int *rk, int *cnt, int *hgt){
    int n=strlen(s), m=26;
    for(int i=0; i<n; i++) rk[i]=s[i]-a;

    //counting sort
    for(int i=0; i<m; i++) cnt[i]=0;
    for(int i=0; i<n; i++) cnt[rk[i]]++;
    for(int i=1; i<m; i++) cnt[i]+=cnt[i-1];
    for(int i=n-1; i>=0; i--) sa[--cnt[rk[i]]]=i;
  
    for(int len=1; len<n; len*=2){
        //stp.1 fill sa2[]
        int p=0;
        for(int i=n-len; i<n; i++) sa2[p++]=i;
        for(int i=0; i<n; i++) if(sa[i]>=len) sa2[p++]=sa[i]-len;
        //stp.2 fill sa[], countig sort
        for(int i=0; i<m; i++) cnt[i]=0;
        for(int i=0; i<n; i++) cnt[rk[i]]++;
        for(int i=1; i<m; i++) cnt[i]+=cnt[i-1];
        for(int i=n-1; i>=0; i--) 
            sa[--cnt[rk[sa2[i]]]]=sa2[i];
        //stp.1 and stp.2 together are radix sort

        //fill rk[]
        swap(rk, sa2);
        rk[sa[0]]=0;
        for(int i=1; i<n; i++)
            rk[sa[i]]=rk[sa[i-1]]+!same(sa2, sa[i-1], sa[i], len);

        m=rk[sa[n-1]]+1;
        if(m==n) break;
    }

    //CALCULATE hgt[]
    hgt[0]=0;
    for(int i=0, j, lcp=0; i<n; i++){
        if(rk[i]){
            lcp?--lcp:0;
            j=sa[rk[i]-1];
            for(; s[j+lcp]==s[i+lcp]; lcp++);
            hgt[rk[i]]=lcp;
        }
    }  
}

 

说明:

1.针对字符集是‘a‘-‘z‘的情况

2.后缀数组sa[ ]和hight数组hgt[ ]的计算合在函数SA()中

 

以上是关于后缀数组模板的主要内容,如果未能解决你的问题,请参考以下文章

后缀数组

后缀数组总结

后缀数组

●后缀数组○十三个例题

后缀数组之倍增算法

后缀树组 学习笔记