用SAM实现后缀排序
Posted mrclr
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用SAM实现后缀排序相关的知识,希望对你有一定的参考价值。
因为本人几乎不会后缀数组,所以遇到这种SA的模板题也要拿SAM解决。
还是有一点思维难度的。
首先按照国际惯例,建反串的SAM。
然后对于这个反串,我们考虑两个前缀哪一个字典序小:因为是串是反的,所以要从后往前比较,那么第一个不相同的字符一定是两个前缀在后缀树上的节点的lca的前一位。记其中一个节点的任意一个endpos的位置是\(End[i]\),lca的长度是\(len[x]\),那么这个字符就是\(s[n - (End[i] - len[x])]\)。
这样对于后缀树上的每一个节点,定义\(tp[i] = s[n - (End[i] - len[link[i]])] - 'a'\),然后以\(tp[i]\)为关键字进行基数排序就好了。
最后建出一棵新的树,在上面dfs一遍即可。
luogu的板儿字符集太大,会MLE,用map又TLE了,而且不想手写哈希表,于是就没放链接。
#include<cstdio>
#include<iostream>
#include<cmath>
#include<algorithm>
#include<cstring>
#include<cstdlib>
#include<cctype>
#include<vector>
#include<queue>
#include<assert.h>
#include<ctime>
using namespace std;
#define enter puts("")
#define space putchar(' ')
#define Mem(a, x) memset(a, x, sizeof(a))
#define In inline
#define forE(i, x, y) for(int i = head[x], y; ~i && (y = e[i].to); i = e[i].nxt)
typedef long long ll;
typedef double db;
const int INF = 0x3f3f3f3f;
const db eps = 1e-8;
const int maxn = 1.1e6 + 5;
inline ll read()
ll ans = 0;
char ch = getchar(), last = ' ';
while(!isdigit(ch)) last = ch, ch = getchar();
while(isdigit(ch)) ans = (ans << 1) + (ans << 3) + ch - '0', ch = getchar();
if(last == '-') ans = -ans;
return ans;
inline void write(ll x)
if(x < 0) x = -x, putchar('-');
if(x >= 10) write(x / 10);
putchar(x % 10 + '0');
In void MYFILE()
#ifndef mrclr
freopen("ha.in", "r", stdin);
freopen("ha.out", "w", stdout);
#endif
int n;
char s[maxn];
int ans[maxn], acnt = 0;
struct Edge
int nxt, to;
e[maxn << 1];
int head[maxn << 1], ecnt = -1;
In void addEdge(int x, int y)
e[++ecnt] = (Edge)head[x], y;
head[x] = ecnt;
struct Sam
int las, cnt;
int tra[maxn << 1][27], link[maxn << 1], len[maxn << 1], id[maxn << 1], End[maxn << 1];
In void init() id[0] = link[las = cnt = 0] = -1;
In void insert(int c, int x)
int now = ++cnt, p = las;
End[now] = len[now] = len[p] + 1, id[now] = x;
while(~p && !tra[p][c]) tra[p][c] = now, p = link[p];
if(p == -1) link[now] = 0;
else
int q = tra[p][c];
if(len[q] == len[p] + 1) link[now] = q;
else
int clo = ++cnt; id[clo] = -1;
memcpy(tra[clo], tra[q], sizeof(tra[q]));
len[clo] = len[p] + 1, End[clo] = len[q];
link[clo] = link[q], link[q] = link[now] = clo;
while(~p && tra[p][c] == q) tra[p][c] = clo, p = link[p];
las = now;
int tp[maxn << 1], pos[maxn << 1], buc[maxn << 1];
In void solve()
for(int i = 1; i <= cnt; ++i) tp[i] = s[n - End[i] + len[link[i]]] - 'a', ++buc[tp[i]];
for(int i = 1; i <= cnt; ++i) buc[i] += buc[i - 1];
for(int i = 1; i <= cnt; ++i) pos[buc[tp[i]]--] = i;
for(int i = cnt; i; --i) addEdge(link[pos[i]], pos[i]);
//按tp的权值从大到小加边,这样dfs的时候就是从小到大
In void dfs(int now)
if(~id[now]) ans[++acnt] = id[now];
forE(i, now, v) dfs(v);
In void _Print()
for(int i = 1; i <= cnt; ++i) printf("now:%d fa:%d len:%d End:%d tp:%d\n", i, link[i], len[i], End[i], tp[i]);
S;
int main()
// MYFILE();
Mem(head, -1);
scanf("%s", s);
n = strlen(s); S.init();
for(int i = n - 1; i >= 0; --i) S.insert(s[i] - 'a', i);
S.solve(), S.dfs(0);
// S._Print();
for(int i = 1; i <= acnt; ++i) write(ans[i]), space; enter;
return 0;
以上是关于用SAM实现后缀排序的主要内容,如果未能解决你的问题,请参考以下文章