SPOJ REPEATS - Repeats - 后缀数组
Posted newbielyx
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SPOJ REPEATS - Repeats - 后缀数组相关的知识,希望对你有一定的参考价值。
Description
求一个字符串内重复次数最多的连续字串。
Solution
先考虑如何如何求一个串给定的串的最大重复次数,枚举一个可能的循环节长度 (l),然后求原串和原串去掉前 (l) 个字符后两个串的 (lcp)(最长公共前缀),如果能完全匹配上,就是一个循环节,且循环次数为 (lcp(l,i)/l + 1)。
所以我们可以先枚举一个可能的长度 (l),然后再枚举起点 (i),然后通过求 (suf[i],suf[i+l]) 的 (lcp) 进行判断。但是其实并不需要枚举每个 (i),只需要枚举 (l) 的整数倍。
如果最优串的开始位置恰好在 (l) 的倍数上,那我们找到的最大的 (k) 就是正确答案。
如果不在 (l) 的倍数上,那么只可能是在 (i-(l-lcp(i,i+l)\% l))。(具体证明戳上面的链接)
Code
#include <algorithm>
#include <cstdio>
#include <iostream>
using namespace std;
const int _ = 1e5 + 10;
const int INF = 0x3f3f3f3f;
int N, rk[_], sa[_], height[_];
char s[_];
void SA() {
int M = 125, p;
static int buc[_], id[_], fir[_], oldrk[_];
fill(buc + 1, buc + M + 1, 0);
for (int i = 1; i <= N; ++i) ++buc[rk[i] = s[i]];
for (int i = 1; i <= M; ++i) buc[i] += buc[i - 1];
for (int i = N; i >= 1; --i) sa[buc[rk[i]]--] = i;
for (int len = 1; len < N; len <<= 1, M = p) {
p = 0;
for (int i = N; i > N - len; --i) id[++p] = i;
for (int i = 1; i <= N; ++i)
if (sa[i] > len) id[++p] = sa[i] - len;
fill(buc + 1, buc + M + 1, 0);
for (int i = 1; i <= N; ++i) ++buc[fir[i] = rk[id[i]]];
for (int i = 1; i <= M; ++i) buc[i] += buc[i - 1];
for (int i = N; i >= 1; --i) sa[buc[fir[i]]--] = id[i];
copy(rk + 1, rk + N + 1, oldrk + 1);
p = 0;
for (int i = 1; i <= N; ++i) {
if (i == 1)
rk[sa[i]] = ++p;
else {
int x = sa[i], y = sa[i - 1];
if (oldrk[x] == oldrk[y] && oldrk[x + len] == oldrk[y + len])
rk[sa[i]] = p;
else
rk[sa[i]] = ++p;
}
}
if (p == N) break;
}
for (int i = 1, k = 0; i <= N; ++i) {
if (rk[i] == 1)
k = 0;
else {
if (k > 0) --k;
int j = sa[rk[i] - 1];
while (i + k <= N && j + k <= N && s[i + k] == s[j + k]) ++k;
}
height[rk[i]] = k;
}
}
namespace ST {
int st[_][21], lg[_];
void init() {
lg[0] = -1;
for (int i = 1; i <= N; ++i) st[i][0] = height[i], lg[i] = lg[i >> 1] + 1;
for (int j = 1; j <= 20; ++j)
for (int i = 1; i + (1 << j) - 1 <= N; ++i)
st[i][j] = min(st[i][j - 1], st[i + (1 << (j - 1))][j - 1]);
}
int query(int x, int y) {
if (x > y) swap(x, y);
++x;
int s = lg[y - x + 1];
return min(st[x][s], st[y - (1 << s) + 1][s]);
}
} // namespace ST
int lcp(int l, int r) {
int x = rk[l], y = rk[r];
return ST::query(x, y);
}
int ans = 0;
void solve() {
for (int L = 1; L <= N; L++) {
for (int i = 1; i + L <= N; i += L) {
int R = lcp(i, i + L);
ans = max(ans, R / L + 1);
if (i >= L - R % L) {
ans = max(lcp(i - L + R % L, i + R % L) / L + 1, ans);
}
}
}
}
int main() {
#ifndef ONLINE_JUDGE
freopen("repeat.in", "r", stdin);
freopen("repeat.out", "w", stdout);
#endif
int T;
scanf("%d", &T);
while (T--) {
ans = 0;
scanf("%d", &N);
for (int i = 1; i <= N; ++i) {
char tmp[5];
scanf("%s", tmp);
s[i] = tmp[0];
}
SA();
ST::init();
solve();
printf("%d
", ans);
}
return 0;
}
以上是关于SPOJ REPEATS - Repeats - 后缀数组的主要内容,如果未能解决你的问题,请参考以下文章
SPOJ REPEATS - Repeats(后缀数组[重复次数最多的连续重复子串])