HDU - 5008 Boring String Problem(后缀树求本质不同第k大子串)

Posted Frozen_Guardian

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HDU - 5008 Boring String Problem(后缀树求本质不同第k大子串)相关的知识,希望对你有一定的参考价值。

题目链接:点击查看

题目大意:给出一个长度为 n n n 的字符串,再给出 m m m 次询问,每次询问需要输出本质不同第 k k k 小的子串的起止位置。如果有多个答案,输出起点最小的那个。强制在线。

题目分析:后缀树的模板题,在后缀树上按照字典序前序遍历维护一下前缀和(子串个数),然后对于每次询问就可以二分查找答案在哪个节点了。

具体难点有两条:

  1. 如何在后缀树上按照字典序遍历
  2. 如何维护每个子串首次出现的位置

对应的解决方案如下:

  1. 根据 parent 树边的性质将子节点排序
  2. 维护 endpos 的极值

那么如何求后缀树呢?其实只需要将字符串反转一下,然后扔到后缀自动机里,此时求出的 p a r e n t parent parent 树就是后缀树了。

原理也十分简单,考虑 p a r e n t parent parent 树的叶子节点到根节点的一条路径,表示的是一个前缀的所有后缀,反转一下自然就变成了一个后缀的所有前缀,也就是后缀树了。

因为本题需要记录相应子串的首次出现位置,所以可以维护一下反串中每个节点的 e n d p o s endpos endpos 的最大值用于答案输出。

剩下的就是亿点点坐标转换的细节了,大家可以用样例以及:

abcd
1
0
ans=1 1

这组样例自己调一下,都能调过去的话应该就没有问题了。

代码:

// #pragma GCC optimize(2)
// #pragma GCC optimize("Ofast","inline","-ffast-math")
// #pragma GCC target("avx,sse2,sse3,sse4,mmx")
#include<iostream>
#include<cstdio>
#include<string>
#include<ctime>
#include<cmath>
#include<cstring>
#include<algorithm>
#include<stack>
#include<climits>
#include<queue>
#include<map>
#include<set>
#include<sstream>
#include<cassert>
#include<bitset>
#include<list>
#include<unordered_map>
#define lowbit(x) (x&-x)
using namespace std;
typedef long long LL;
typedef unsigned long long ull;
template<typename T>
inline void read(T &x)
{
	T f=1;x=0;
	char ch=getchar();
	while(0==isdigit(ch)){if(ch=='-')f=-1;ch=getchar();}
	while(0!=isdigit(ch)) x=(x<<1)+(x<<3)+ch-'0',ch=getchar();
	x*=f;
}
template<typename T>
inline void write(T x)
{
	if(x<0){x=~(x-1);putchar('-');}
    if(x>9)write(x/10);
    putchar(x%10+'0');
}
const int inf=0x3f3f3f3f;
const int N=1e5+100;
char s[N];
vector<int>node[N<<1];
int tot,last,endpos[N<<1];
LL sum[N<<1];
int rk[N<<1],dfn;
struct Node
{
    int ch[26];
    int fa,len;
}st[N<<1];
inline int newnode()
{
	tot++;
	for(int i=0;i<26;i++)
		st[tot].ch[i]=0;
	st[tot].fa=st[tot].len=0;
	endpos[tot]=0;
	node[tot].clear();
	return tot;
}
void add(int x)
{
    int p=last,np=last=newnode();
    st[np].len=st[p].len+1;
    while(p&&!st[p].ch[x])st[p].ch[x]=np,p=st[p].fa;
    if(!p)st[np].fa=1;
    else
    {
        int q=st[p].ch[x];
        if(st[p].len+1==st[q].len)st[np].fa=q;
        else
        {
            int nq=newnode();
            st[nq]=st[q]; st[nq].len=st[p].len+1;
            st[q].fa=st[np].fa=nq;
            while(p&&st[p].ch[x]==q)st[p].ch[x]=nq,p=st[p].fa;//向上把所有q都替换成nq
        }
    }
}
void dfs_pos(int u) {
	for(auto v:node[u]) {
		dfs_pos(v);
		endpos[u]=max(endpos[u],endpos[v]);
	}
}
void dfs(int u,int fa) {
	if(u!=1) {
		dfn++;
		sum[dfn]=sum[dfn-1]+(st[u].len-st[fa].len);
		rk[dfn]=u;
	}
	vector<pair<char,int>>son;
	for(auto v:node[u]) {
		son.push_back({s[endpos[v]-st[u].len],v});
	}
	sort(son.begin(),son.end());
	for(auto it:son) {
		dfs(it.second,u);
	}
}
void build() {
	for(int i=1;i<=tot;i++) {
		node[st[i].fa].push_back(i);
	}
	dfs_pos(1);
	dfs(1,-1);
}
void init()
{
	last=1;
	dfn=tot=0;
	newnode();
}
int main()
{
#ifndef ONLINE_JUDGE
//	freopen("data.in.txt","r",stdin);
//	freopen("data.out.txt","w",stdout);
#endif
//	ios::sync_with_stdio(false);
	while(scanf("%s",s+1)!=EOF) {
		init();
		int n=strlen(s+1);
		reverse(s+1,s+1+n);
		for(int i=1;i<=n;i++) {
			add(s[i]-'a');
			endpos[last]=i;
		}
		build();
		int m;
		scanf("%d",&m);
		LL l=0,r=0;
		while(m--) {
			LL k;
			scanf("%lld",&k);
			k=(k^l^r)+1;
			if(k<=sum[dfn]) {
				int t=lower_bound(sum+1,sum+1+dfn,k)-sum;
				int u=rk[t];
				int len=st[u].len-(sum[t]-k);
				l=n-endpos[u]+1;
				r=l+len-1;
			} else {
				l=r=0;
			}
			printf("%lld %lld\\n",l,r);
		}
	}
	return 0;
}

以上是关于HDU - 5008 Boring String Problem(后缀树求本质不同第k大子串)的主要内容,如果未能解决你的问题,请参考以下文章

HDU - 5008 Boring String Problem(后缀树求本质不同第k大子串)

HDU - 5008 Boring String Problem(后缀树求本质不同第k大子串)

HDU - 5008 Boring String Problem(后缀树求本质不同第k大子串)

HDOJ 5008 Boring String Problem

[HDU3518]Boring counting

HDU 5056 Boring count(数学)