HDU - 7091 重叠的子串(后缀自动机+set启发式合并+树上倍增)
Posted Frozen_Guardian
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HDU - 7091 重叠的子串(后缀自动机+set启发式合并+树上倍增)相关的知识,希望对你有一定的参考价值。
题目链接:点击查看
题目大意:给定一个只含小写字母的字符串 s s s 和 q q q 次询问,每次询问给定一个字符串,以 s [ l . . r ] s[l..r] s[l..r] 的形式给出,判断 s s s 中是否存在两个或多个出现的有重叠部分的给定子串。比如在 “ a b a b a ” “ababa” “ababa” 中,两个 “ a b a ” “aba” “aba” 子串就重叠于中间的字母 “ a ” “a” “a”,而两个 “ a b ” “ab” “ab” 子串就没有发生重叠。 T T T 组数据。
题目分析:对字符串 s s s 建立 S A M SAM SAM 然后建出 p a r e r e n t parerent parerent 树,问题就转换为了子串 s [ l : r ] s[l:r] s[l:r] 所在的节点,是否存在着相邻的两个 e n d p o s endpos endpos 距离小于 r − l + 1 r-l+1 r−l+1
针对上面的问题,可以用 s e t set set 启发式合并预处理出任意一个节点中相邻两个 e n d p o s endpos endpos 的最小值,时间复杂度是 O ( n l o g 2 n ) O(nlog^2n) O(nlog2n) 的
对于每次查询,我们只需要从 s [ 1 : r ] s[1:r] s[1:r] 不断跳 f a t h e r father father 直到 s [ l : r ] s[l:r] s[l:r] 所在的区间就可以了,这里可以用树上倍增优化,时间复杂度是 O ( q l o g n ) O(qlogn) O(qlogn) 的
代码:
// Problem: 重叠的子串
// Contest: HDOJ
// URL: https://acm.hdu.edu.cn/showproblem.php?pid=7091
// Memory Limit: 524 MB
// Time Limit: 20000 ms
//
// Powered by CP Editor (https://cpeditor.org)
// #pragma GCC optimize(2)
// #pragma GCC optimize("Ofast","inline","-ffast-math")
// #pragma GCC target("avx,sse2,sse3,sse4,mmx")
#include<iostream>
#include<cstdio>
#include<string>
#include<ctime>
#include<cmath>
#include<cstring>
#include<algorithm>
#include<stack>
#include<climits>
#include<queue>
#include<map>
#include<set>
#include<sstream>
#include<cassert>
#include<bitset>
#include<list>
#include<unordered_map>
#define lowbit(x) (x&-x)
using namespace std;
typedef long long LL;
typedef unsigned long long ull;
template<typename T>
inline void read(T &x)
{
T f=1;x=0;
char ch=getchar();
while(0==isdigit(ch)){if(ch=='-')f=-1;ch=getchar();}
while(0!=isdigit(ch)) x=(x<<1)+(x<<3)+ch-'0',ch=getchar();
x*=f;
}
template<typename T>
inline void write(T x)
{
if(x<0){x=~(x-1);putchar('-');}
if(x>9)write(x/10);
putchar(x%10+'0');
}
const int inf=0x3f3f3f3f;
const int N=1e5+100;
char s[N];
int tot,last,dp[N<<1][20],val[N<<1],pos[N];
vector<int>node[N<<1];
set<int>endpos[N<<1];
struct Node
{
int ch[26];
int fa,len;
}st[N<<1];
inline int newnode()
{
tot++;
for(int i=0;i<26;i++)
st[tot].ch[i]=0;
st[tot].fa=st[tot].len=0;
node[tot].clear(),endpos[tot].clear();
val[tot]=inf;
return tot;
}
void add(int x)
{
int p=last,np=last=newnode();
st[np].len=st[p].len+1;
while(p&&!st[p].ch[x])st[p].ch[x]=np,p=st[p].fa;
if(!p)st[np].fa=1;
else
{
int q=st[p].ch[x];
if(st[p].len+1==st[q].len)st[np].fa=q;
else
{
int nq=newnode();
st[nq]=st[q]; st[nq].len=st[p].len+1;
st[q].fa=st[np].fa=nq;
while(p&&st[p].ch[x]==q)st[p].ch[x]=nq,p=st[p].fa;//向上把所有q都替换成nq
}
}
}
void dfs(int u,int fa) {
dp[u][0]=fa;
for(int i=1;i<20;i++) {
dp[u][i]=dp[dp[u][i-1]][i-1];
}
for(auto v:node[u]) {
dfs(v,u);
val[u]=min(val[u],val[v]);
if(endpos[u].size()<endpos[v].size()) {
swap(endpos[u],endpos[v]);
}
for(auto it:endpos[v]) {
auto itt=endpos[u].lower_bound(it);
if(itt!=endpos[u].end()) {
val[u]=min(val[u],*itt-it);
}
if(itt!=endpos[u].begin()) {
itt--;
val[u]=min(val[u],it-*itt);
}
endpos[u].insert(it);
}
}
}
void build() {
for(int i=1;i<=tot;i++) {
node[st[i].fa].push_back(i);
}
dfs(1,0);
}
int get_fa(int u,int len) {
for(int i=19;i>=0;i--) {
if(st[dp[u][i]].len>=len) {
u=dp[u][i];
}
}
return u;
}
void init()
{
last=1;
tot=0;
newnode();
}
int main()
{
#ifndef ONLINE_JUDGE
// freopen("data.in.txt","r",stdin);
// freopen("data.out.txt","w",stdout);
#endif
// ios::sync_with_stdio(false);
int w;
cin>>w;
while(w--) {
init();
int n,m;
scanf("%d%d%s",&n,&m,s+1);
for(int i=1;i<=n;i++) {
add(s[i]-'a');
pos[i]=last;
endpos[last].insert(i);
}
build();
while(m--) {
int l,r;
scanf("%d%d",&l,&r);
int len=r-l+1;
int fa=get_fa(pos[r],len);
if(val[fa]<len) {
puts("Yes");
} else {
puts("No");
}
}
}
return 0;
}
以上是关于HDU - 7091 重叠的子串(后缀自动机+set启发式合并+树上倍增)的主要内容,如果未能解决你的问题,请参考以下文章
不在B中的A的子串数量 HDU - 4416 (后缀自动机模板题目)
hdu 3518 Boring counting 后缀数组 height分组