loj6171/bzoj4899 记忆的轮廊(期望dp+优化)

Posted 人活着就是为了Chelly

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了loj6171/bzoj4899 记忆的轮廊(期望dp+优化)相关的知识,希望对你有一定的参考价值。

题目:

https://loj.ac/problem/6171

分析:

设dp[i][j]表示从第i个点出发(正确节点),还可以有j个存档点(在i点使用一个存档机会),走到终点n的期望步数

那么

a[i][k]表示i点为存档点,从i点走到k点(正确节点)的期望步数(中间没有其它存档点)

那么a[i][j]可以递推预处理出

其中g[v]表示从一个错误节点v开始走,期望走g[v]步会读档

解方程可以解出

s[j-1]就是点j-1出去的所有错误儿子的g[v]之和

那么接下来只要知道如何求g[v]就行了

这个直接dfs一遍就行了

好,那么现在我们的主dp就可以求解了

但是直接dp的复杂度是O(n^2p)的,这样会TLE

方法一:

注意到这个dp的本质是把一个序列给分成p段,那么其中某一段会不会很长呢?

我们会发现a的增长是非常快的,而最终的答案不会很大,所以也就是说当前的i的最优转移j,不会离i太远

所以通过计算可以发现这个距离step<=40

所以时间复杂度O(40n^2)

方法二:

考虑dp优化的惯用套路

容易得出此dp是决策单调的,也就是f(i)<=f(i+1)

那么就可以决策单调优化O(nplogn)

具体的就维护一个队列,队列里每个元素存着[l,r,p]表示区间l~r,当前最优决策是p

每次从队头取出最优策略,将此次新的决策从队尾开始放入并合并区间

 1         dp[1][n]=0.0;
 2         for(int now=2;now<=number;++now)
 3         {
 4             int head=1,tail=1;
 5             q[1]={1,n-1,n};
 6             for(int i=n-1;i>=1;--i)
 7             {
 8                 while(head<tail&&q[head].l>i) ++head;
 9                 dp[now][i]=cal(now-1,i,q[head].p);
10                 while(head<tail&&cal(now-1,q[tail].r,i)<cal(now-1,q[tail].r,q[tail].p)) --tail;
11                 int position=find(now,q[tail].l,q[tail].r,i,q[tail].p);
12                 if(position)
13                 {
14                     q[tail+1]={1,position,i};
15                     q[tail].l=position+1;
16                     if(q[tail].l>q[tail].r) ++head;
17                     ++tail;
18                 }
19             }
20         }
View Code

方法三:

一个很神奇的二分套路(详见王钦石《浅析一类二分方法》)

这是一个限制段数的dp,我们把它写成不限制段数的情况

然后我们去二分一个常数C,使得式子变成这样

这里的C表示每次重新开一段所需要的代价

很明显,C越大,最优情况下分的段数就越少,C越小,最优情况下分的段数就越多

所以我们可以二分C,对于每个C,进行dp

通过n->pre[n]->pre[pre[n]]->...->1,我们可以知道存了多少次档,当存档数恰好等于p的时候,此时对应的划分方案就是读档p次时候的最优解,就是将dp的最优值减去C*p

但是有个trick,王钦石论文里也提到了

就是可能当前eps下,并没有哪个C会使得我恰好读了p次档,即某个C情况下,我读了p-1次档,在C-eps情况下,我读了p+1次档,就是没有读p次档

这时候有个结论就是C-eps时,我读p+1次档这个情况下也必定有我读p次档的解,此时原本答案是dp-(p+1)*C,现在这样改成读p次档之后,答案就是dp-p*C

这样复杂度是O(n^2logA)

当然这里的dp可以优化,但不过预处理的时候O(n^2)是跑不掉的,所以再优化也不会低于O(n^2)的复杂度

 1         int minnum=m+1;
 2         while (l+eps<=r)
 3         {
 4             long double mid=(l+r)/2;
 5             int num=check(mid);
 6             long double sum=0;
 7             for(int now=n;now!=1;now=pre[now]) sum+=w[pre[now]][now];
 8             if (num<=p)
 9             {
10                 if (num==p)
11                 {
12                     ans=sum;
13                     break;
14                 };
15                 r=mid-eps;
16             }
17             else
18             {
19                 if(num<=minnum)
20                 {
21                     ans=sum+(num-p)*mid;
22                     minnum=num;
23                 }
24                 l=mid+eps;
25             }
26         }
View Code

 

以上是关于loj6171/bzoj4899 记忆的轮廊(期望dp+优化)的主要内容,如果未能解决你的问题,请参考以下文章

bzoj 4899 记忆的轮廓 题解(概率dp+决策单调性优化)

XSY2518记忆(memory)(状压dp,概率与期望,概率dp)

考后反思(bzoj3940 bzoj4899 bzoj3307)

loj 2542 随机游走 —— 最值反演+树上期望DP+fmt

loj #6342. 跳一跳 期望dp

loj6191「美团 CodeM 复赛」配对游戏 概率期望dp