XSY3347串后缀

Posted dcdcbigbig

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了XSY3347串后缀相关的知识,希望对你有一定的参考价值。

原题:2018 ICPC Asia-East Continent Final J

想看原题解的可以去看吉老师的直播题解

题意:

技术分享图片

技术分享图片

题解:

(dllca膜你赛搬原题差评)

考虑题目中给出的式子的含义,实际上相当于要给串$s$的每个后缀分配一个概率$p_i$满足$sumlimits_{i=1}^{n}p_i=1$,然后取其中一个与其它后缀的lcp期望值最小的后缀,要做的就是求出一种最优的分配p的方案使得最后的最小值最大;

先不考虑后缀,考虑若干个lcp为0(即没有公共前缀)的字符串如何分配最优:

设有$m$个串$s_1,s_2,...,s_m$,长度分别为$l_1,l_2,...,l_m$,那么取其中一个串$s_t$对答案的贡献是$p_tl_t$,最后的答案就是$min{p_tl_t}$;

一个结论:要使答案最大,所有$p_tl_t$的值必定相等;

如果不全相等,答案就是其中最小的那个,则必然可以通过调整$p$使得最小的那个增加一点,其他的全部减小一点,从而使答案更优;

于是可以列出一个方程组:

$$egin{cases}sumlimits_{i=1}^{n}p_i=1 \\ p_1l_1=p_2l_2=cdots=p_nl_n=kend{cases}$$

其中$k$就是答案,联立两式得:

$$k=frac{1}{frac{1}{l_1}+frac{1}{l_2}+cdots+frac{1}{l_n}}$$

显然就可以直接求出$k$了;

回到原问题,涉及到快速求后缀的lcp容易想到先构造出后缀树,由于后缀树本质上还是一棵trie树,因此一个节点所有的后继节点以及向下的子树所表示的字符串在这个点向后的部分都是没有公共前缀的,所以可以用上面的方法来处理;

注意到其实某一个节点子树中的问题是整个后缀树上问题完全等价的子问题,因此可以在后缀树上dfs,父节点直接加上子树的答案继续合并即可;

dfs的时候注意如果一个节点本身已经是原串某一个后缀的尾节点那么它的后继节点肯定没有贡献,直接返回0即可;

于是就做完了,讲了这么多代码还是很短的!

代码:

 1 #include<algorithm>
 2 #include<iostream>
 3 #include<cstring>
 4 #include<cstdio>
 5 #include<cmath>
 6 #include<queue>
 7 #define inf 2147483647
 8 #define eps 1e-9
 9 using namespace std;
10 typedef long long ll;
11 typedef double db;
12 struct edge{
13     int v,next;
14 }a[1000001];
15 int t,n,tot,last,rt,tote,head[1000001],son[1000001][26],mx[1000001],fa[1000001],isp[1000001];
16 char s[200001];
17 void add(int u,int v){
18     a[++tote].v=v;
19     a[tote].next=head[u];
20     head[u]=tote;
21 }
22 void extend(int ch){
23     int p=last,np=++tot;
24     mx[np]=mx[p]+1;
25     for(;p&&!son[p][ch];p=fa[p])son[p][ch]=np;
26     if(!p)fa[np]=rt;
27     else{
28         int q=son[p][ch];
29         if(mx[q]==mx[p]+1)fa[np]=q;
30         else{
31             int nq=++tot;
32             mx[nq]=mx[p]+1;
33             memcpy(son[nq],son[q],sizeof(son[q]));
34             fa[nq]=fa[q];
35             fa[q]=fa[np]=nq;
36             for(;p&&son[p][ch]==q;p=fa[p])son[p][ch]=nq;
37         }
38     }
39     isp[np]=true;
40     last=np;
41 }
42 db dfs(int u){
43     if(isp[u])return 0;
44     db ret=0;
45     for(int tmp=head[u];tmp!=-1;tmp=a[tmp].next){
46         int v=a[tmp].v;
47         ret+=1.0/(dfs(v)+mx[v]-mx[u]);
48     }
49     return 1.0/ret;
50 }
51 int main(){
52     memset(head,-1,sizeof(head));
53     scanf("%d",&t);
54     while(t--){
55         scanf("%s",s);
56         n=strlen(s);
57         rt=last=++tot;
58         for(int i=n-1;i>=0;i--){
59             extend(s[i]-a);
60         }
61         for(int i=rt+1;i<=tot;i++){
62             add(fa[i],i);
63         }
64         printf("%.10lf
",dfs(rt));
65     }
66     return 0;
67 }

以上是关于XSY3347串后缀的主要内容,如果未能解决你的问题,请参考以下文章

[XSY 1516] 兔子的字符串 后缀数组

[xsy1260]短信加密

[xsy2242]回文子串

哈希是好东西,二分+哈希是更好的东西

[BZOJ2555]SubString

XSY2538/HDU6155Subsequence Count(矩阵乘法+线段树)