POJ2778 DNA Sequence
Posted waing
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了POJ2778 DNA Sequence相关的知识,希望对你有一定的参考价值。
POJ2778 DNA Sequence
题意 :给 m 个字符串(只包含 A , T , C , G ), 问有多少长度为 n 的字符串不含有这 m 个字串
? 0 <= m <= 10 , 1 <= n <=2000000000,字符串长度不超过10
题解 :
? 这是一个字符串匹配问题,我们首先想到 AC 自动机,建完 AC 自动机后怎么操作呢,因为字符串是不确定的,我们想到了动态规划。
? 一个字符串,我们在它后面加上一个字符,如果它还是不含这 m 个字串,那就说明这个字符是可以加上去的,那么我们就成功的把 n 长度的状态转移到了 n+1 长度的状态。
? 这个题的算法就出来了,我们在 AC 自动机上进行计数 dp,对于每一个节点,我们考虑在它后面添加字符,如果添加完后转移到的节点及其所有的 fail 指针没有指向字符结尾的节点,说明这是一个有效转移.
f[i] [j]代表长度为i的字符串在j节点时的方案数,起始状态 f[0] [0]=1.
Q :n 是20亿怎么办?
A : 发现每一次转移的方程都是一样的,我们改用矩阵进行转移,用矩阵快速幂就可以做到复杂度为
[
sum^{m}_{i=1} length of string*log n
]
这种题居然写了100行
#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cstring>
#include<queue>
using namespace std;
int read()
{
int k=0,f=1;char c=getchar();
for(;!isdigit(c);c=getchar()) if(c=='-') f=-1;
for(;isdigit(c);c=getchar()) k=k*10+c-'0';return k*f;
}
const int N=405;
const int mod=100000;
int n,m,L;
int tot,ch[N][4],val[N],fail[N];
char s[N];
queue<int> q;
struct matrix
{
long long a[105][105];
matrix() {memset(a,0,sizeof(a));}
matrix operator *(const matrix &b)
{
matrix c;
for(int i=0;i<=tot;i++)
for(int j=0;j<=tot;j++)
for(int k=0;k<=tot;k++)
c.a[i][j]=(c.a[i][j]+a[i][k]*b.a[k][j])%mod;
return c;
}
};
int Pow(int x,int k) {int ans=1;for(;k;k>>=1,x=1ll*x*x%mod) if(k&1) ans=1ll*ans*x%mod;return ans;}
int get(char x)
{
if(x=='A') return 0;
else if(x=='T') return 1;
else if(x=='C') return 2;
return 3;
}
void ins(char *s)
{
int now=0;
for(int i=0;s[i];i++)
{
int x=get(s[i]);
if(!ch[now][x]) tot++,ch[now][x]=tot;
now=ch[now][x];
}
val[now]=1;
}
void build()
{
for(int i=0;i<4;i++)
if(ch[0][i]) q.push(ch[0][i]);
while(!q.empty())
{
int u=q.front();q.pop();
for(int i=0;i<4;i++)
if(!ch[u][i]) ch[u][i]=ch[fail[u]][i];
else fail[ch[u][i]]=ch[fail[u]][i],q.push(ch[u][i]);
}
}
matrix ksm(matrix a,int p)
{
matrix c;
c.a[0][0]=1;
for(;p;p>>=1,a=a*a)
if(p&1)
c=c*a;
return c;
}
int main()
{
m=read();n=read();
if(!m) {printf("%d
",Pow(4,n));return 0;}
for(int i=1;i<=m;i++)
scanf("%s",s),ins(s);
build();
matrix a,b;
for(int i=0;i<=tot;i++)
{
for(int j=0;j<4;j++)
{
int fl=1;
for(int k=i;;k=fail[k])
{
if(val[ch[k][j]])
{
fl=0;
break;
}
if(!k) break;
}
a.a[i][ch[i][j]]+=fl;
}
}
b=ksm(a,n);
int ans=0;
for(int i=0;i<=tot;i++)
for(int j=0;j<=tot;j++)
ans=(ans+b.a[i][j])%mod;
printf("%d
",ans);
return 0;
}
以上是关于POJ2778 DNA Sequence的主要内容,如果未能解决你的问题,请参考以下文章
线性代数(矩阵乘法):POJ 2778 DNA Sequence
POJ2778 DNA Sequence(AC自动机+矩阵快速幂)