学习笔记:后缀数组

Posted 123456

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了学习笔记:后缀数组相关的知识,希望对你有一定的参考价值。

后缀数组是指对于后缀排序后,每个后缀的位置:sa[rank]=pos:排名为rank的后缀是pos->len这个后缀

note:rank[pos]=rank:位置为pos的串排名为rank

白书上的代码简洁明了,很容易理解。

核心思想:我们对于每个位置开始的后缀,不直接计算,先计算从这个位置开始,向后1位是第几小,然后向后2位,向后4位,一直到*2>n,这时就算好了后缀数组

复杂度:O(n*log(n)^2) :倍增log(n),快排log(n)

代码:

bool cp(int x,int y)
{
    //rank(2*k)[x]和rank(2*k)[y]可以由rank(k)[x],rank(k)[x+k]和rank(k)[y],rank(k)[y+k]比较得出
    if(rank[x]!=rank[y]) return rank[x]<rank[y];
    int rx=x+k<=n?rank[x+k]:-1;//当前位置是x,向后k位超出了长度,那么很明显,rank[x+k]是不存在的,也可以看做一个空串,rank=-1
    int ry=y+k<=n?rank[y+k]:-1;
    return rx<ry;
}
void sa(string s)
{
    //******排名:第几小
    n=s.length();
    for(int i=0;i<=n;i++)
    {
        sa[i]=i; rank[i]=i<n?s[i]:-1;
    }
    for(k=1;k<=n;k*=2)
    {
        sort(sa,sa+n+1,cp);//sa排序,sa存的是每个排名的位置,也就是每个排名对应的串
        //sa[0]即为排名为0的串对应的位置
        temp[sa[0]]=0;//第一个rank为0
        for(int i=1;i<=n;i++)
        {
            temp[sa[i]]=temp[sa[i-1]]+(cp(sa[i-1],sa[i]));//计算名次,因为sa已经排好序,这里计算如果两个串相等,那么排名一样,否则排名+1
        }
        for(int i=0;i<=n;i++)
        {
            rank[i]=temp[i];//直接赋值,上面那个因为是按sa排序,所以按sa赋值
        }
    }
}

 

以上是关于学习笔记:后缀数组的主要内容,如果未能解决你的问题,请参考以下文章

[后缀数组]学习笔记未完

后缀树组 学习笔记

学习笔记:python3,代码片段(2017)

PHP 学习笔记:基础教程:语法,变量,函数,数组,超全局

DOM探索之基础详解——学习笔记

●后缀数组○十三个例题