浅谈斜率优化

Posted aegir

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了浅谈斜率优化相关的知识,希望对你有一定的参考价值。

对于一类形如:$F_i=\min_L_i≤j≤R_i \F_j+val(i, j) \$ 的动态规划模型,我们有两种优化方法。

  • 当$val(i,j)$的每一项仅与$i,j$中的一个有关时,我们可以使用单调队列进行优化。
  • 当$val(i,j)$中包含$i,j$的乘积项时,我们可以使用斜率优化

我们主要关注第二种情况,即如何维护斜率以实现快速的转移。


Luogu P2365 任务安排

设:$sumT_i=\sum_j=1^iT_j,\ sumF_i=\sum_j=1^iF_j$,$F_i$表示把前$i$个任务分成若干批次处理的最小代价。

不难写出:$F_i=\min_0≤j<i \F_j+sumT_i*(sumF_i-sumF_j)+S*(sumF_N-sumF_j) \$

如果只是要通过本题,那么$O(n^2)$的算法足矣。但是我们还可以继续优化,最终到达$O(n)$的复杂度。

 

不妨设两个决策$0≤j<k<i$且$k$优于$j$(稍后会解释为什么要设$j<k$)。

有:$F_k+sumT_i*(sumF_i-sumF_k)+S*(sumF_N-sumF_k) <= F_j+sumT_i*(sumF_i-sumF_j)+S*(sumF_N-sumF_j)$

化简移项后有:$F_k-F_j<=(sumT_i-S)(sumF_k-sumF_j)$

注意到$sumF$是单调递增的,我们之前设$j<k$,所以这里$sumF_k-sumF_j>0$(除过去不变号)。我们把它除过去,化成一个斜率式。

即:$\fracF_k-F_jsumF_k-sumF_j<=SumT_i-S$。

 

注意到这个式子形如:$\fracy_2-y_1x_2-x_1$这样的斜率式。于是把每个决策$j$看成一个坐标为$(sumF_j,F_j)$的点。

那么上面式子的意义就是:若$j<k$且$j,k$的斜率小于等于$sumT_i-S$,则$k$比$j$优。

那要怎么优化呢?我们考虑维护一个决策队列$q$,注意到如果队列里的决策斜率是单调递增的,那么只要队首$q_l,q_l+1$的斜率大于$sumT_i-S$,那么队首就是最优决策。于是我们维护一个斜率单调递增的队列(斜率递增,即一个下凸壳)。

  • 对于队首,我们只需检查$q_l,q_l+1$的斜率是否小于等于$sumT_i-S$,如果小于等于,说明$q_l+1$优于$q_l$,则将$q_l$出队(由于$sumT-S$递增,所以$q_l$不会再对之后的$sumT_i-S$产生贡献)。
  • 对于队尾,每次转移完$i$后,都要往$q$里加入决策点$(sumF_i,F_i)$。注意到$sumF$也是递增的,所以我们只需比较$(q_r-1,q_r,i)$这三个点是否满足斜率递增,如果不满足,说明$q_r-1,q_r$的斜率过大,我们将$q_r$出队,继续判断新的队尾是否构成斜率递增关系即可。

 

每个决策都只会进队和出队一次,所以复杂度是$O(n)$的。

 1 #include<cstdio>
 2 using namespace std;
 3 
 4 const double esp = 1e-8;
 5 const int MAXN = 1000010;
 6 
 7 int N, S, F[MAXN];
 8 int sumT[MAXN], sumC[MAXN];
 9 int l, r, q[MAXN];
10 
11 int X(int i)  return F[i]; 
12 
13 int Y(int i)  return sumC[i]; 
14 
15 double Slope(int i, int k)  return (double) (X(i) - X(k)) / (Y(i) - Y(k)); 
16 
17 int main()
18 
19     scanf("%d %d", &N, &S);
20     for(int i = 1; i <= N; ++i)
21     
22         scanf("%d %d", &sumT[i], &sumC[i]);
23         sumT[i] += sumT[i - 1];
24         sumC[i] += sumC[i - 1];
25     
26     q[l = r = 1] = 0;
27     for(int i = 1; i <= N; ++i)
28     
29         while(l < r && Slope(q[l + 1], q[l]) - (S + sumT[i]) < esp) ++l;
30         int j = q[l];
31         F[i] = F[j] + sumT[i] * (sumC[i] - sumC[j]) + S * (sumC[N] - sumC[j]);
32         while(l < r && Slope(i, q[r]) - Slope(q[r], q[r - 1]) < esp) --r;
33         q[++r] = i;
34     
35     printf("%d\n", F[N]);
36     return 0;
37 

 

拓展:

注意到上面的题目有两个特殊性质,即$sumT-S, sumF$单调递增。第一个性质保证了我们只需保留队列中斜率大于$sumT-S$的部分(就是说从队首出队后,对之后的$sumT-S$都没有贡献。即出队后不可能再入队),第二个性质告诉我们每次新加入的点一定在最末尾,只需和队尾比较斜率即可。

  • 如果$sumT-S$不单调,那我们就不能从队首出队任何元素。由于这是一个单调队列,可以进行二分,在$O(logn)$的时间内找到斜率大于当前的$sumT-S$的决策点位置。
  • 如果$sumF$不单调,我们就需要在任何位置插入决策点,可以用平衡树来维护(即维护一个动态凸壳)。

例题1:uogu P3628 [APIO2010]特别行动队

令$s_i$为前缀和,$f_i$表示前$i$个士兵的最大和,显然有:$f_i=\max_0≤j<i \f_j+calc(i,j)\$

$calc(i,j)$表示$j+1~i$的士兵分在一起的代价。

按照套路设$0≤j<k<i$,$k$优于$j$。

于是有:$\frac(f_k+as_k^2-bs_k)-(f_j+as_j^2-bs_j)s_k-s_j≥2as_i$

维护一个单调递减的队列。发现$2as$是递减的,可以在队首直接进行操纵。因为$s$是递增的,所以一定是在队尾插入决策点。

因为满足上面两个性质,直接$O(n)$维护即可。

 1 #include<bits/stdc++.h>
 2 using namespace std;
 3 
 4 typedef long long ll;
 5 const int MAXN = 1000010;
 6 
 7 int n, a, b, c, l, r;
 8 int x[MAXN], q[MAXN];
 9 ll sum[MAXN], f[MAXN];
10 
11 double slope(int k, int j)
12 
13     return (double)((f[k] + a * sum[k] * sum[k] - b * sum[k]) - (f[j] + a * sum[j] * sum[j] - b * sum[j])) / (sum[k] - sum[j]);
14 
15 
16 int main()
17 
18     scanf("%d %d %d %d", &n, &a, &b, &c);
19     for(int i = 1; i <= n; ++i)
20     
21         scanf("%d", &x[i]);
22         sum[i] = sum[i - 1] + x[i];
23     
24     f[0] = q[l = r = 1] = 0;
25     for(int i = 1; i <= n; ++i)
26     
27         while(l < r && slope(q[l], q[l + 1]) >= 2.0 * a * sum[i]) ++l;
28         f[i] = f[q[l]] + a * (sum[i] - sum[q[l]]) * (sum[i] - sum[q[l]]) + b * (sum[i] - sum[q[l]]) + c;
29         while(l < r && slope(q[r - 1], q[r]) <= slope(q[r], i)) --r;
30         q[++r] = i;
31     
32     printf("%lld\n", f[n]);
33     return 0;
34 

 例题2:

以上是关于浅谈斜率优化的主要内容,如果未能解决你的问题,请参考以下文章

浅谈带权二分或者斜率凸优化

UVALive 4726 Average ——(斜率优化DP)

DP斜率优化

斜率优化规律

模板斜率优化dp

斜率优化小结