P3809 后缀排序(倍增法后缀数组)
Posted jpphy0
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了P3809 后缀排序(倍增法后缀数组)相关的知识,希望对你有一定的参考价值。
问题
分析
- 基数排序
- 第2关键字排序后,再对第1关键字分桶
- 然后再按第2关键字的(逆)序遍历,即可将第1关键字的同一桶内元素排序
代码
/* P3809 后缀排序 */
// 排名(rank):无并列,例如:0、1、2、3、4、5、……
// 排序:有并列, 例如:0、0、1、2、2,……
#include<bits/stdc++.h>
using namespace std;
const int MXN = 1e6+10;
char s[MXN]; // 字符串
int n; // 字符串长度
int fir[MXN]; // 第1关键字排序, 下标 -> 排序;fir[i]:下标为i的后缀的排序为fir[i]
int sec[MXN]; // 第2关键字排名, 排名 -> 下标;sec[i]:排名为i的后缀的下标为sec[i]
int c[MXN]; // 对第1关键字的排序计数
int sa[MXN]; // 是当前第1和第2关键字的总排名,也是下一次的第1关键字序, 排名 -> 下标
void calc_sa(){
int *x = fir, *y = sec, m = 256;
// for(int i = 0; i < n; ++i) x[i] = s[i] /* - 'a' */; // x: 第1关键字排序
for(int i = 0; i < m; ++i) c[i] = 0;
for(int i = 0; i < n; ++i) ++c[x[i] = s[i]]; // 第1关键字排序计数
for(int i = 1; i < m; ++i) c[i] += c[i-1];
for(int i = n-1; i >= 0; --i) sa[--c[x[i]]] = i; // 下标从0开始
for(int p, k = 1; k <= n; k <<= 1){
/* 构建长度2k时的第2关键字排名 */
p = 0; // 第2关键字的排名
for(int i = n-k; i < n; ++i) y[p++] = i; // 无第2关键字,排名最小
// 按序i遍历, sa[i](位置)在[0, k-1]内的不能成为第2关键字;否则是位置sa[i]-k的第2关键字序
for(int i = 0; i < n; ++i) if(sa[i] >= k) y[p++] = sa[i] - k; // 转换:i -> p
/* 长度k的排名结果sa是长度2k时的第1关键字排名 */
for(int i = 0; i < m; ++i) c[i] = 0;
for(int i = 0; i < n; ++i) ++c[x[i]]; // 对第1关键字排序计数
// for(int i = 0; i < n; ++i) ++c[x[sa[i]]]; // 对第1关键字排序计数
// for(int i = 0; i < n; ++i) ++c[x[y[i]]]; // 对第1关键字排序计数(参考资料基本此法)
for(int i = 0; i < m; ++i) c[i] += c[i-1];
for(int i = n-1; i >= 0; --i) sa[--c[x[y[i]]]] = y[i];// 按第2关键字的序遍历,得到第1、2关键字的排名
// 获取本次结果的排序,它是下一次的第1关键字排序,为下一轮做准备
swap(x, y); // 交换:第1关键字的排序 和 第2关键字的排名;
p = 1, x[sa[0]] = 0;
for(int i = 1; i < n; ++i) // 第1、2关键字排序相同,则排序并列;越界时,第1关键字必不等
x[sa[i]] = (y[sa[i-1]] == y[sa[i]] && y[sa[i-1]+k] == y[sa[i]+k])?p-1:p++;
if(p >= n) break; // 所有后缀长度不一,排名必然不一,即p必可以到n
m = p;
}
}
int main(){
scanf("%s", s);
n = strlen(s) + 1; // 包括串结束符,结束符构成的后缀排序必最小,且无并列
calc_sa();
for(int i = 1; i < n-1; ++i) printf("%d ", sa[i]+1);
printf("%d\\n", sa[n-1]+1);
// for(int i = 1; i < n; ++i) printf("%s\\n", s+sa[i]); // 有效的后缀排名从1开始
return 0;
}
以上是关于P3809 后缀排序(倍增法后缀数组)的主要内容,如果未能解决你的问题,请参考以下文章