Codeforces 802I Fake News (hard) (SA+单调栈) 或 SAM

Posted tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Codeforces 802I Fake News (hard) (SA+单调栈) 或 SAM相关的知识,希望对你有一定的参考价值。

原文链接http://www.cnblogs.com/zhouzhendong/p/9026184.html

题目传送门 - Codeforces 802I

题意

  求一个串中,所有本质不同子串的出现次数的平方和。

  $|s|\\leq 10^5$

题解

  首先,这一题用 SAM 做就是模板题,比较简单。

  但是,本着练一练 SA 的心态,我开始了 SA+单调栈 的苦海。

  真毒瘤。

  这里讲一讲 SA 的做法,也是经典的做法。

   SA 闭着眼睛先写了再说。

  首先,我们考虑出现次数大于 $1$ 次的子串。

  考虑按照$SA$数组的顺序来进行处理,这样得到的后缀的字典序不断变大。

  如果要统计一个串与前一个串的 LCP 出现了多少次,该如何统计?

  显然是往前和往后都找到第一个 LCP 比当前小的停止并统计。

  于是我们用单调栈来维护一个 $height$ 升序的序列。具体的统计方法这里不多赘述,可以直接查阅代码。比较明了。

  单调栈要注意处理当前 LCP 和栈顶 LCP 长度值相同的情况。

  考虑只出现一次的串个数。对于第 $i$ 大的后缀(即 $SA[i]$ ),之前统计到的是 $SA[i]$ 与 $SA[i-1]$ 、$SA[i]$ 与 $SA[i+1] $ 的 LCP 的 $\\max$ 。于是没用统计到的就是剩下的。于是当前后缀出现依次的串对答案的贡献就是 $len-\\max$ 。

代码

#include <bits/stdc++.h>
using namespace std;
typedef long long LL;
const int N=100005;
int T,n,m,SA[N],rank[N],height[N],tmp[N],tax[N];
char s[N];
int st[N],top,pos[N];
void Sort(int n,int m){
	for (int i=0;i<=m;i++)
		tax[i]=0;
	for (int i=1;i<=n;i++)
		tax[rank[i]]++;
	for (int i=1;i<=m;i++)
		tax[i]+=tax[i-1];
	for (int i=n;i>=1;i--)
		SA[tax[rank[tmp[i]]]--]=tmp[i];
}
bool cmp(int rk[],int x,int y,int w){
	return rk[x]==rk[y]&&rk[x+w]==rk[y+w];
}
void Suffix_Array(char s[],int n){
	memset(SA,0,sizeof SA);
	memset(tmp,0,sizeof tmp);
	memset(rank,0,sizeof rank);
	memset(height,0,sizeof height);
	for (int i=1;i<=n;i++)
		rank[i]=s[i],tmp[i]=i;
	m=127;
	Sort(n,m);
	for (int w=1,p=0;p<n;w<<=1,m=p){
		p=0;
		for (int i=n-w+1;i<=n;i++)
			tmp[++p]=i;
		for (int i=1;i<=n;i++)
			if (SA[i]>w)
				tmp[++p]=SA[i]-w;
		Sort(n,m);
		swap(rank,tmp);
		rank[SA[1]]=p=1;
		for (int i=2;i<=n;i++)
			rank[SA[i]]=cmp(tmp,SA[i],SA[i-1],w)?p:++p;
	}
	for (int i=1,j,k=0;i<=n;height[rank[i++]]=k)
		for (k=max(k-1,0),j=SA[rank[i]-1];s[i+k]==s[j+k];k++);
}
int main(){
	scanf("%d",&T);
	while (T--){
		scanf("%s",s+1);
		n=strlen(s+1);
		Suffix_Array(s,n);
		LL ans=0;
		top=0;
		memset(st,0,sizeof st);
		memset(pos,0,sizeof pos);
		SA[n+1]=height[0]=0;
		for (int i=2;i<=n+1;i++){
			int nowpos=i,len=height[i];
			while (top>0&&st[top]>len){
				LL v1=st[top]-max(st[top-1],len);
				LL v2=i-pos[top]+1;
				ans+=v1*v2*v2;
				nowpos=pos[top--];
			}
			while (top>0&&st[top]==len)
				nowpos=pos[top--];
			st[++top]=len;
			pos[top]=nowpos;
		}
		for (int i=1;i<=n;i++)
			ans+=n-i+1-max(height[rank[i]],height[rank[i]+1]);
		printf("%I64d\\n",ans);
	}
	return 0;
}

  

以上是关于Codeforces 802I Fake News (hard) (SA+单调栈) 或 SAM的主要内容,如果未能解决你的问题,请参考以下文章

字符串程序运行后得到奇怪的东西新手

谣言检测论文精读——11.SAFE: Similarity-Aware Multi-Modal Fake News Detection

16.6 假新闻识别 Fake News Detection on Social Media A Data Mining Perspective

Codeforces 1167C - News Distribution

fakeapp如何应用在长视频中

pua.fakeapp,ru@android啥病毒