P3809 后缀排序(倍增法后缀数组)

Posted jpphy0

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了P3809 后缀排序(倍增法后缀数组)相关的知识,希望对你有一定的参考价值。

问题

分析

  • 基数排序
  • 第2关键字排序后,再对第1关键字分桶
  • 然后再按第2关键字的(逆)序遍历,即可将第1关键字的同一桶内元素排序

代码

/* P3809 后缀排序 */
// 排名(rank):无并列,例如:0、1、2、3、4、5、…… 
// 排序:有并列, 例如:0、0、1、2、2,……
#include<bits/stdc++.h>
using namespace std;
const int MXN = 1e6+10;
char s[MXN];    // 字符串
int n;          // 字符串长度
int fir[MXN];   // 第1关键字排序, 下标 -> 排序;fir[i]:下标为i的后缀的排序为fir[i]
int sec[MXN];   // 第2关键字排名, 排名 -> 下标;sec[i]:排名为i的后缀的下标为sec[i]
int c[MXN];     // 对第1关键字的排序计数
int sa[MXN];    // 是当前第1和第2关键字的总排名,也是下一次的第1关键字序, 排名 -> 下标
void calc_sa(){
    int *x = fir, *y = sec, m = 256;
    // for(int i = 0; i < n; ++i) x[i] = s[i] /* - 'a' */; // x: 第1关键字排序
    for(int i = 0; i < m; ++i) c[i] = 0;
    for(int i = 0; i < n; ++i) ++c[x[i] = s[i]]; // 第1关键字排序计数
    for(int i = 1; i < m; ++i) c[i] += c[i-1];
    for(int i = n-1; i >= 0; --i) sa[--c[x[i]]] = i; // 下标从0开始
    for(int p, k = 1; k <= n; k <<= 1){
        /* 构建长度2k时的第2关键字排名 */
        p = 0; // 第2关键字的排名
        for(int i = n-k; i < n; ++i) y[p++] = i; // 无第2关键字,排名最小
        // 按序i遍历, sa[i](位置)在[0, k-1]内的不能成为第2关键字;否则是位置sa[i]-k的第2关键字序
        for(int i = 0; i < n; ++i) if(sa[i] >= k) y[p++] = sa[i] - k; // 转换:i -> p
        
        /* 长度k的排名结果sa是长度2k时的第1关键字排名 */
        for(int i = 0; i < m; ++i) c[i] = 0;
        for(int i = 0; i < n; ++i) ++c[x[i]];        // 对第1关键字排序计数
        // for(int i = 0; i < n; ++i) ++c[x[sa[i]]]; // 对第1关键字排序计数
        // for(int i = 0; i < n; ++i) ++c[x[y[i]]];  // 对第1关键字排序计数(参考资料基本此法)
        for(int i = 0; i < m; ++i) c[i] += c[i-1];
        for(int i = n-1; i >= 0; --i) sa[--c[x[y[i]]]] = y[i];// 按第2关键字的序遍历,得到第1、2关键字的排名

        // 获取本次结果的排序,它是下一次的第1关键字排序,为下一轮做准备
        swap(x, y); // 交换:第1关键字的排序 和 第2关键字的排名;
        p = 1, x[sa[0]] = 0;
        for(int i = 1; i < n; ++i)  // 第1、2关键字排序相同,则排序并列;越界时,第1关键字必不等
            x[sa[i]] = (y[sa[i-1]] == y[sa[i]] && y[sa[i-1]+k] == y[sa[i]+k])?p-1:p++;
       
        if(p >= n) break; // 所有后缀长度不一,排名必然不一,即p必可以到n
        m = p;
    }
}
int main(){
    scanf("%s", s);
    n = strlen(s) + 1; // 包括串结束符,结束符构成的后缀排序必最小,且无并列
    calc_sa();
    for(int i = 1; i < n-1; ++i) printf("%d ", sa[i]+1);
    printf("%d\\n", sa[n-1]+1);
    // for(int i = 1; i < n; ++i) printf("%s\\n", s+sa[i]); // 有效的后缀排名从1开始
    return 0;
}

以上是关于P3809 后缀排序(倍增法后缀数组)的主要内容,如果未能解决你的问题,请参考以下文章

后缀数组-倍增法

luogu P3809 模板后缀排序

后缀数组(模板)

P3809 模板后缀排序

用倍增法求后缀数组名次数组-JavaScript

P3809 模板后缀排序