洛谷P4094 - [TJOI2016]字符串

Posted

V

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了洛谷P4094 - [TJOI2016]字符串相关的知识,希望对你有一定的参考价值。

Portal

Description

给出一个字符串\(s(|s|\leq10^5)\)\(m\)次询问,每次询问子串\(s[x_1..x_2]\)的所有子串和\(s[y_1..y_2]\)的最长公共前缀长度的最大值。

Solution

后缀数组+二分答案+主席树。
易知\(s[x_1..x_2]\)的所有子串可以视为\(s[x_1..x_2]\)的所有后缀。那么可以得到:
\[ ans=max\{ min(lcp(i,y_1),x_2-i+1,y_2-y_1+1)\} \quad (i\in [x_1,x_2])\] \(lcp(i,j)\)表示后缀\(i\)与后缀\(j\)的最长公共前缀长度。用后缀数组可以在\(O(nm)\)内搞定。
考虑二分答案\(ans\in [0,min(x_2-i+1,y_2-y_1+1)]\),二分结果为\(len\)。由于\(lcp(i,y_1)\)相当于一段区间的最小值,那么\(rnk[i]\)\(rnk[y_1]\)越远就越小。那么我们可以再次二分来找到一个区间\([fr,to]\)\(\forall i\in [fr,to]\),有\(lcp(sa[i],y_1)\geq len\)。那么检查是否有\(sa[i]\in [x_1,x_2-len+1]\),若有则说明\(len\)合法,扩大\(len\);否则不合法,缩小\(len\)
于是我们要做的就是求\(sa\)的某个区间内是否有某个数在某个范围内。对\(sa\)建立\(n\)棵线段树,第\(i\)棵的第\(j\)位为\(1\)表示在\(sa[1..i]\)中有\(j\)。询问时查询两棵线段树的差即可。

时间复杂度\(O((n+m)logn)\)

Code

//[TJOI2016]字符串
#include <cstdio>
#include <cstring>
inline int read()
{
    int x=0; char ch=getchar();
    while(ch<'0'||'9'<ch) ch=getchar();
    while('0'<=ch&&ch<='9') x=x*10+ch-'0',ch=getchar();
    return x;
}
inline int min(int x,int y) {return x<y?x:y;}
inline int swap(int &x,int &y) {int t=x; x=y,y=t;}
const int N=1e5+10;
int n,m; char s[N];
int sa[N],rnk[N<<1],h[N];
int cnt[N],tmp[N],rnk1[N];
int lg2[N],st[N][18];
void getSA()
{
    memset(cnt,0,sizeof cnt);
    for(int i=1;i<=n;i++) cnt[s[i]]=1;
    for(int i=1;i<=256;i++) cnt[i]+=cnt[i-1];
    for(int i=1;i<=n;i++) rnk[i]=cnt[s[i]];
    for(int L=1,k=0;k<n;L<<=1)
    {
        memset(cnt,0,sizeof cnt);
        for(int i=1;i<=n;i++) cnt[rnk[i+L]]++;
        for(int i=1;i<=n;i++) cnt[i]+=cnt[i-1];
        for(int i=n;i>=1;i--) tmp[cnt[rnk[i+L]]--]=i;
        memset(cnt,0,sizeof cnt);
        for(int i=1;i<=n;i++) cnt[rnk[tmp[i]]]++;
        for(int i=1;i<=n;i++) cnt[i]+=cnt[i-1];
        for(int i=n;i>=1;i--) sa[cnt[rnk[tmp[i]]]--]=tmp[i];
        k=0;
        for(int i=1;i<=n;i++)
        {
            if(rnk[sa[i]]!=rnk[sa[i-1]]||rnk[sa[i]+L]!=rnk[sa[i-1]+L]) k++;
            rnk1[sa[i]]=k;
        }
        memcpy(rnk,rnk1,sizeof rnk1);
    }
    for(int i=1,k=0;i<=n;i++)
    {
        if(rnk[i]==1) {h[1]=k=0; continue;}
        if(k) k--;
        while(s[i+k]==s[sa[rnk[i]-1]+k]) k++;
        h[rnk[i]]=k;
    }
    lg2[1]=0; for(int i=2;i<=n;i++) lg2[i]=lg2[i>>1]+1;
    for(int i=1;i<=n;i++) st[i][0]=h[i];
    for(int k=1;(1<<k)<=n;k++)
        for(int i=1;i+(1<<k)-1<=n;i++)
            st[i][k]=min(st[i][k-1],st[i+(1<<k-1)][k-1]);
}
int lcp(int x,int y)
{
    if(x==y) return n-x+1;
    int i=rnk[x],j=rnk[y]; if(i>j) swap(i,j);
    i++;
    int t=lg2[j-i+1];
    return min(st[i][t],st[j-(1<<t)+1][t]);
}
int ndCnt,rt[N];
struct node{int chL,chR; int cnt;} nd[N*18];
void update(int p) {nd[p].cnt=nd[nd[p].chL].cnt+nd[nd[p].chR].cnt;}
void ins(int &p,int L0,int R0,int x)
{
    nd[++ndCnt]=nd[p]; p=ndCnt;
    if(L0==R0) {nd[p].cnt++; return;}
    int mid=L0+R0>>1;
    if(x<=mid) ins(nd[p].chL,L0,mid,x);
    else ins(nd[p].chR,mid+1,R0,x);
    update(p);
}
int optL,optR;
int qres;
void query(int p1,int p2,int L0,int R0)
{
    if(p1==p2) return;
    if(optL<=L0&&R0<=optR) {qres+=nd[p2].cnt-nd[p1].cnt; return;}
    int mid=L0+R0>>1;
    if(optL<=mid) query(nd[p1].chL,nd[p2].chL,L0,mid);
    if(mid<optR) query(nd[p1].chR,nd[p2].chR,mid+1,R0);
}
int x1,x2,y1,y2;
bool check(int len)
{
    int fr=1,fr1=rnk[y1];
    while(fr<=fr1)
    {
        int mid=fr+fr1>>1;
        if(lcp(sa[mid],y1)<len) fr=mid+1;
        else fr1=mid-1;
    }
    int to=rnk[y1],to1=n;
    while(to<=to1)
    {
        int mid=to+to1>>1;
        if(lcp(y1,sa[mid])<len) to1=mid-1;
        else to=mid+1;
    }
    to--;
    optL=x1,optR=x2-len+1,qres=0; query(rt[fr-1],rt[to],1,n);
    return qres>0;
}
int main()
{
    n=read(),m=read(); scanf("%s",s+1);
    getSA();
    for(int i=1;i<=n;i++) ins(rt[i]=rt[i-1],1,n,sa[i]);
    for(int i=1;i<=m;i++)
    {
        x1=read(),x2=read(),y1=read(),y2=read();
        int L=1,R=min(x2-x1+1,y2-y1+1);
        while(L<=R)
        {
            int mid=L+R>>1;
            if(check(mid)) L=mid+1;
            else R=mid-1;
        }
        printf("%d\n",R);
    }
    return 0;
}

以上是关于洛谷P4094 - [TJOI2016]字符串的主要内容,如果未能解决你的问题,请参考以下文章

BZOJ4553/洛谷P4093 [HEOI2016/TJOI2016]序列 动态规划 CDQ分治

洛谷P4093 [HEOI2016/TJOI2016]序列

洛谷 P4093 [HEOI2016/TJOI2016]序列

HEOI2016/TJOI2016 字符串问题

洛谷P3847 [TJOI2007]调整队形

洛谷P3761:[TJOI2017]城市