后缀数组

Posted arbor-one

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了后缀数组相关的知识,希望对你有一定的参考价值。

后缀数组 (SA) 是一种重要的数据结构,通常使用倍增或者DC3算法实现,这超出了我们的讨论范围。

在本题中,我们希望使用快排、Hash与二分实现一个简单的O(nlog2n)的后缀数组求法。

详细地说,给定一个长度为 n 的字符串S(下标 0~n-1),我们可以用整数 k(0≤k<n) 表示字符串S的后缀 S(k~n-1)。

把字符串S的所有后缀按照字典序排列,排名为 i 的后缀记为 SA[i]。

额外地,我们考虑排名为 i 的后缀与排名为 i-1 的后缀,把二者的最长公共前缀的长度记为 Height[i]。

我们的任务就是求出SA与Height这两个数组。

输入格式
输入一个字符串,其长度不超过30万。

字符串由小写字母构成。

输出格式
第一行为数组SA,相邻两个整数用1个空格隔开。

第二行为数组Height,相邻两个整数用1个空格隔开,我们规定Height[1]=0。

输入样例:
ponoiiipoi
输出样例:
9 4 5 6 2 8 3 1 7 0
0 1 2 1 0 0 2 1 0 2

    #include<iostream>
    #include<algorithm>
    #include<stdio.h>
    #include<limits.h>
    #include<cstring>
    using namespace std;
    const int N=300010;
    char str[N];
    int n;
    int sa[N];
    typedef unsigned long long ull;
    ull hl[N],p[N];
    int get(int l,int r)//比较后缀数组的前缀哈希值
    {
        return hl[r]-hl[l-1]*p[r-l+1];
    }
    int get_common(int a,int b)//找到两个下标的相同前缀字符个数
    {  
        int l=0,r=min(n-a+1,n-b+1);
        while(l<r)
        {
            int mid=l+r+1>>1;
            if(get(a,a+mid-1)!=get(b,b+mid-1))
            r=mid-1;
            else
            l=mid;
        }
        return l;
    }
    bool cmp(int a,int b)//比较两个下标的前缀大小
    {
        int l=get_common(a,b);
        int av=a+l>n?INT_MIN:str[a+l];
        int bv=b+l>n?INT_MIN:str[b+l];
        return av<bv;
    }
    
    int main()
    { p[0]=1;
        cin>>str+1;
        n=strlen(str+1);
        for(int i=1;i<=n;i++)
        {
            hl[i]=hl[i-1]*131+str[i]-'a'+1;
            p[i]=p[i-1]*131;
            sa[i]=i;
         }
         sort(sa+1,sa+n+1,cmp);
         for(int i=1;i<=n;i++)
         printf("%d ",sa[i]-1);
         cout<<endl;
        for(int i=1;i<=n;i++)
        {
            if(i==1)
            printf("0 ");
            else
            printf("%d ",get_common(sa[i-1],sa[i]));
        }
        
        return 0;
        
    }

以上是关于后缀数组的主要内容,如果未能解决你的问题,请参考以下文章

VSCode自定义代码片段—— 数组的响应式方法

VSCode自定义代码片段10—— 数组的响应式方法

Sublime Text3自定义代码片段

后缀数组代码详解

●后缀数组○十三个例题

初学后缀数组记录(然而并不是很会。。&&很水。。)