LG5325 模板Min_25筛
Posted autoint
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了LG5325 模板Min_25筛相关的知识,希望对你有一定的参考价值。
P5325 【模板】Min_25筛
题目背景
模板题,无背景。
题目描述
定义积性函数$f(x)$,且$f(p^k)=p^k(p^k-1)$($p$是一个质数),求
$$\\sum_i=1^n f(x)$$
对$10^9+7$取模。
输入输出格式
输入格式:一行一个整数$n$。
输出格式:一个整数表示答案。
输入输出样例
说明
$f(1)=1,f(2)=2,f(3)=6,f(4)=12,f(5)=20$
$f(6)=12,f(7)=42,f(8)=56,f(9)=72,f(10)=40$
对于$30\\%$的数据,保证$1\\le n\\le 10^6$。
对于$100\\%$的数据,保证$1\\le n\\le 10^10$
wucstdio的题解
题意
求\\(\\sum_i=1^nf(i)\\),其中\\(f(i)\\)是一个积性函数,且\\(f(p^k)=p^k(p^k-1)\\)。
Min_25筛
为什么这个筛法叫做Min25筛呢?因为这个算法是Min25发明的。
假设我们要求一个\\(\\sum_i=1^nf(i)\\),满足\\(f(x)\\)是一个积性函数,且\\(f(p^e)\\)是一个关于\\(p\\)的低阶多项式。
因为多项式可以拆成若干个单项式,所以我们只需要考虑求出\\(f(p)=p^k\\)的前缀和,然后每一项加起来就行了。
那么如何求出每一项的和呢?
分类
让我们先对\\(i\\)按照质数和合数分类:
\\[\\sum_i=1^nf(i)=\\sum_1\\le p\\le nf(p)+\\sum_i=1\\&\\texti is not a prime^nf(i)\\]
然后,我们枚举后面合数的最小质因子以及最小质因子的次数。注意所有合数的最小质因子一定都小于等于\\(\\sqrt n\\):
\\[\\sum_1\\le p\\le nf(p)+\\sum_1\\le p^e\\le n,1\\le p\\le \\sqrt nf(p^e)\\left(\\sum_1\\le i\\le n/p^e\\&minp>pf(i)\\right)\\]
其中\\(minp\\)表示\\(i\\)的最小质因子,因为公式中文太丑了所以就只好写英文了。
这样,整个式子就变成了两个部分,第一部分是所有质数的\\(f\\)之和,另一部分是枚举最小质因子后,求所有最小质因子大于这个质因子的\\(f\\)之和。
辅助函数
由于\\(n\\)实在太大,所以我们没法用线性筛求出所有质数的\\(f\\)和。
我们考虑一个DP的思路(天哪这是怎么想到的):我们不知道从哪里找来了一个DP数组\\(g(n,i)\\),满足
\\[g(n,j)=\\sum_i=1^n[\\texti is a prime or minp$> p_j$]i^k\\]
这里的\\(k\\)就是前面我们说的低阶多项式的一项(此题中\\(k\\in\\1,2\\\\))。注意\\(i^k\\)并不是我们要求的\\(f\\),只是一个和\\(f\\)在质数处的取值一样的完全积性函数,这样后面计算起来比较方便。
这个式子说人话就是\\(g(n,j)\\)表示求\\(1\\)到\\(n\\)之间所有满足条件的数的\\(k\\)次方和,条件就是要么是质数要么最小质因子大于\\(p_j\\)。
我们考虑\\(g(n,j-1)\\)如何转移到\\(g(n,j)\\)。随着\\(j\\)的增大,满足条件的数变少了,所以我们需要减去一些原来满足条件而现在不满足条件的数。
这些数应该是最小质因子恰好为\\(p_j\\)的合数。
我们可以提出来一个\\(p_j\\)作为最小质因子,这样剩下的就不能有小于它的质因子了,也就是\\(g\\left(\\dfracnp_j,j\\right)-g(p_j-1,j-1)\\),后面那个\\(g\\)是为了把所有的质数去掉。
这样我们就得到了\\(g\\)的递推式:
\\[g(n,j)=g(n,j-1)-p_j^k\\left(g\\left(\\dfracnp_j,j\\right)-g(p_j-1,j-1)\\right)\\]
完全积性函数的好处在这里就体现出来了:由于只提出了一个\\(p_i\\),所以后面还有可能有\\(p_i\\)这个因子,如果是完全积性函数的话就可以将函数值直接相乘,而不用管是否互质。
注意到后面的\\(g(p_j-1,j-1)\\)其实就是前\\(j-1\\)个质数的\\(k\\)次方和。由于\\(p_j\\le \\sqrt n\\),所以这一部分可以用线性筛预处理,我们设\\(sp_n=\\sum_i=1^np_i^k\\),也就是前\\(n\\)个质数的\\(k\\)次方和。
\\(1\\)到\\(n\\)中所有质数的\\(k\\)次方和其实就是\\(g(n,x)\\),其中\\(p_x\\)是最后一个小于等于\\(\\sqrt n\\)的质数。为了方便,我们把它记作\\(g(n)\\)。
但是因为\\(n\\)太大,我们还是没法对于每一个\\(n\\)求出\\(g(n,x)\\),所以我们可以想到另一个重要的结论:
\\[\\left\\lfloor\\dfrac\\lfloor\\dfrac na\\rfloorb\\right\\rfloor=\\lfloor\\dfracnab\\rfloor\\]
也就是说,无论你每一次把\\(n\\)除以几,最后你能得到的数一定是某一个\\(\\lfloor\\dfrac nx\\rfloor\\),所以我们没必要算出来所有的\\(n\\),只需要算出可以写成\\(\\lfloor\\dfracnx\\rfloor\\)这种形式的数,这样的数一共有\\(O(\\sqrt n)\\)个。
那么我们如何存储这\\(\\sqrt n\\)个数呢?
首先我们不能直接下标访问,这样下标可以到\\(n\\)。我们需要对下标离散化。
但是离散化之后,我们还需要知道对于每一个\\(\\lfloor\\dfrac nx\\rfloor\\),它对应的下标是什么。
如果偷懒的话可以用map,但是时间复杂度会多一个\\(\\log\\)。我们可以用\\(ind1[x]\\)表示\\(x\\)这个数对应的数组下标,\\(ind2[x]\\)表示\\(n/x\\)这个数对应的下标。这样两个\\(ind\\)数组最大都只会到\\(\\sqrt n\\)。
具体实现可以看代码。数组的记录上需要精细实现一下。
求解答案
答案就是先求出所有质数的函数和,然后先枚举了一个\\(p^e\\),再枚举最小质因子大于\\(p\\)的数。
我们还是可以考虑DP的思想。设\\(S(n,x)\\)表示求\\(1\\)到\\(n\\)中所有最小质因子大于\\(p_x\\)的函数值之和,注意这里是\\(f\\)而不是\\(k\\)次方。答案就是\\(S(n,0)\\)。
我们将满足条件的数分成两部分,第一部分是大于\\(p_x\\)的质数,也就是\\(g(n)-sp_x\\),另一部分是最小质因子大于\\(p_x\\)的合数,枚举最小质因子:
\\[S(n,x)=g(n)-sp_x+\\sum_p_k^e\\le n\\&k>xf(p_k^e)\\left(S\\left(\\dfracnp_k^e,k\\right)+[e\\neq 1]\\right)\\]
这样问题就解决了,我们可以递归求解这个问题。根据某玄学定理,不需要记忆化。
一些细节
\\(1\\)既不是质数也不是合数,不含任何一个质因子,那么求解的过程中\\(g\\)和\\(S\\)到底是否包含\\(1\\)呢?其实是否包含都可以,但是处理上略有差别。我的\\(g\\)和\\(S\\)都没有包含\\(1\\),只需要最后加一就行了。
min25筛的时间复杂度据说是\\(O\\left(\\dfracn^3/4\\log n\\right)\\),也有人说是\\(O(n^1-\\epsilon)\\),在这道题上大致是1e10跑1s左右的样子。但是这个算法常数很小,具体表现参加WC2019课件里面的一张图:(灰色的是min25)

#include<bits/stdc++.h>
#define il inline
#define co const
template<class T>T read()
T data=0,w=1;char ch=getchar();
for(;!isdigit(ch);ch=getchar())if(ch=='-') w=-w;
for(;isdigit(ch);ch=getchar()) data=data*10+ch-'0';
return data*w;
template<class T>il T read(T&x) return x=read<T>();
typedef long long LL;
using namespace std;
co int mod=1e9+7,i2=500000004,i6=166666668;
il int add(int a,int b)
return (a+=b)>=mod?a-mod:a;
il int mul(int a,int b)
return (LL)a*b%mod;
//int fpow(int a,int b) // calc inv
// int ans=1;
// for(;b;b>>=1,a=mul(a,a))
// if(b&1) ans=mul(ans,a);
// return ans;
//
co int N=2e5+1; // edit 1: size
LL n;
int sqr,pri[N],num,sp1[N],sp2[N];
LL w[N];int tot,g1[N],g2[N],ind1[N],ind2[N];
void init()
pri[1]=1;
for(int i=2;i<=sqr;++i)
if(!pri[i])
pri[++num]=i;
sp1[num]=add(sp1[num-1],i);
sp2[num]=add(sp2[num-1],mul(i,i));
for(int j=1;j<=num&&i*pri[j]<=sqr;++j)
pri[i*pri[j]]=1;
if(i%pri[j]==0) break;
int S(LL x,int y)
if(pri[y]>=x) return 0;
int k=x<=sqr?ind1[x]:ind2[n/x];
int ans=add(add(g2[k],mod-g1[k]),mod-add(sp2[y],mod-sp1[y]));
for(int i=y+1;i<=num&&(LL)pri[i]*pri[i]<=x;++i)
LL p=pri[i];
for(int e=1;p<=x;++e,p=p*pri[i])
int t=p%mod;
ans=add(ans,mul(t,mul(t-1,add(S(x/p,i),e!=1))));
return ans;
int main()
sqr=ceil(sqrt(read(n))),init();
// part 1
for(LL l=1,r;l<=n;l=r+1) // init g(w,0)
r=n/(n/l);
w[++tot]=n/l; // big->small
g1[tot]=g2[tot]=w[tot]%mod;
g1[tot]=mul(i2,mul(g1[tot],g1[tot]+1)),g1[tot]=add(g1[tot],mod-1);
g2[tot]=mul(i6,mul(g2[tot],mul(g2[tot]+1,2*g2[tot]+1))),g2[tot]=add(g2[tot],mod-1);
if(n/l<=sqr) ind1[n/l]=tot;
else ind2[n/(n/l)]=tot;
for(int i=1;i<=num;++i) // DP g(w,i)
for(int j=1;j<=tot&&(LL)pri[i]*pri[i]<=w[j];++j)
int k=w[j]/pri[i]<=sqr?ind1[w[j]/pri[i]]:ind2[n/(w[j]/pri[i])];
g1[j]=add(g1[j],mod-mul(pri[i],add(g1[k],mod-sp1[i-1])));
g2[j]=add(g2[j],mod-mul(pri[i],mul(pri[i],add(g2[k],mod-sp2[i-1]))));
// part 2
printf("%d\\n",add(S(n,0),1));
return 0;
这题数组空间,我开刚好\\(\\sqrtn\\),也就是1e5,就会炸掉。试了一下开到2e5才过。大概是数据有问题。
以上是关于LG5325 模板Min_25筛的主要内容,如果未能解决你的问题,请参考以下文章