后缀数组备忘
Posted gloid
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了后缀数组备忘相关的知识,希望对你有一定的参考价值。
SA写了就忘,SAM根本学不会,没救。
SA模板:
int n,sa[N],sa2[N],rk[N<<1],tmp[N<<1],h[N],cnt[N],f[N][20],lg2[N];
//sa[i] 在原串中排名第i的长度为k子串以sa[i]为开头(相同串在前面的排名靠前) rk[i] 在原串中以i为开头的长度为k子串排名第rk[i](相同串排名相同)
//sa2[i] 辅助基数排序,在k+1~n+k中排名第i的长度为k子串以sa2[i]+k开头 tmp[i] 临时存储rk[i] cnt[i] 计数役
//f[i][j] st表,用以查询lcp lg2[i] 字面意思
//注意rk和tmp开两倍 char s[N]; void make() { int m=0;//本质不同长度为k的子串个数 for (int i=1;i<=n;i++) cnt[rk[i]=s[i]]++,m=max(m,(int)s[i]);//名次数组中,初始排名即字符本身 for (int i=1;i<=m;i++) cnt[i]+=cnt[i-1]; for (int i=n;i>=1;i--) sa[cnt[rk[i]]--]=i;//后缀数组中,相同字符原串中在前面的排名靠前 for (int k=1;k<=n;k<<=1)//对长度为2k的子串排序 { int p=0;//计数役 for (int i=n-k+1;i<=n;i++) sa2[++p]=i;//这些串为空串显然最靠前 for (int i=1;i<=n;i++) if (sa[i]>k) sa2[++p]=sa[i]-k;//根据sa构造sa2,排名靠前的子串如果范围合法显然应该靠前 memset(cnt,0,sizeof(cnt)); for (int i=1;i<=n;i++) cnt[rk[i]]++; for (int i=1;i<=m;i++) cnt[i]+=cnt[i-1]; for (int i=n;i>=1;i--) sa[cnt[rk[sa2[i]]]--]=sa2[i];//基数排序,若前k位相同则后k位靠前的优先,因此以sa2倒序枚举 memcpy(tmp,rk,sizeof(rk)); p=rk[sa[1]]=1; for (int i=2;i<=n;i++) { if (tmp[sa[i]]!=tmp[sa[i-1]]||tmp[sa[i]+k]!=tmp[sa[i-1]+k]) p++;//判断与前一个是否本质不同,这里用到两倍数组 rk[sa[i]]=p; } if (p==n) break;//全部本质不同说明排序完成 m=p; } for (int i=1;i<=n;i++) { h[i]=max(h[i-1]-1,0);//重要性质,设h[i]为以i开头的后缀在名次数组中与上一后缀的lcp,则h[i]>=h[i-1]-1 while (s[i+h[i]]==s[sa[rk[i-1]]+h[i]]) h[i]++; } for (int i=1;i<=n;i++) f[i][0]=h[sa[i]]; lg2[1]=0; for (int i=2;i<=n;i++) { lg2[i]=lg2[i-1]; if ((2<<lg2[i])<=i) lg2[i]++; } for (int j=1;j<20;j++) for (int i=1;i<=n;i++) f[i][j]=min(f[i][j-1],f[min(n,i+(1<<j-1))][j-1]); } int query(int x,int y) { if (x>y) swap(x,y); x++;if (x>y) return N; return min(f[x][lg2[y-x+1]],f[y-(1<<lg2[y-x+1])+1][lg2[y-x+1]]);//lcp转化为区间rmq问题,排名第x的后缀和排名第y的后缀的lcp应为h[x+1]~h[y]的min }
以上是关于后缀数组备忘的主要内容,如果未能解决你的问题,请参考以下文章