$CDQ$分治总结

Posted 2020-10-22 guessycb

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了$CDQ$分治总结相关的知识，希望对你有一定的参考价值。

A.\$CDQ\$ 分治

特别基础的教程略。

\$CDQ\$分治的优缺点：
( 1 )优点：代码量少，常数极小，可以降低处理维数。
( 2 )缺点：必须离线处理。

\$CDQ\$分治与其他分治最本质的不同在于：

分治到达\$[L,R]\$时，分治处理\$[L,mid]\$与\$[mid+1,R]\$
然后递归上来合并的时候：
只考虑 [L,mid]中元素对 [mid+1,R] 中元素的影响

看起来这句话非常简单，但只要正真理解了这句话，也就理解了\$CDQ\$分治。
只要是满足这个原则的分治，都是可以称作\$CDQ\$分治的。
下面给出几个例子，都是为了理解这句话：

例题1:

给定长度为\$10^5\$的一个序列，有一下两种操作：
（1）type=1：x val ,把序列第x位置的元素加上val
（2）type=2：x y , 求解[x,y]元素值的和

树状数组大水题.....
如果用\$CDQ\$分治呢？(~~虽然非常非常没有必要~~).
我们把求解\$[x,y]\$元素之和拆分为求前缀和\$pre[y]-pre[x-1]\$。
那么会对\$pre[x]\$产生影响的为：操作时间在其之前，修改位置\$\\leq x\$的修改操作。
建立二元组\$(time , x)\$，外部以time排序，然后分治。
分治时，每次以\$x\$归并排序,
合并\$[L,mid]\$与\$[mid+1,R]\$时，统计\$[L,mid]\$有几个修改操作。
那么如果在\$[mid+1,R]\$碰到了修改操作，自然此时的统计数即为答案。
注意到上面：只统计[L,mid]的修改，只计算[mid+1,R]的答案。
这就是\$CDQ\$分治的关键所在，因为这样统计可以做到不重不漏，代码见这里。

例题2：

三维偏序问题：
给定\$n\$个元素，每个元素有三个属性\$a,b,c\$。
定义\$f(i) = \\sum_{i=1}^n [i!=j]\\times [a_j<a_i 且 b_j<b_i 且 c_j<c_i]\$
试计算\$f(1),f(2),...f(n)\$，数据范围 \$n \\leq 10^5\$。

三维偏序是\$CDQ\$分治的最经典应用。
先确定分治原则：
建立三元组\$(a,b,c)\$，外部先按照\$a\$排序，消除\$a\$的影响。
然后分治内部以\$b\$为准则进行归并。此时我们保证了\$a_j<a_i\$与\$b_j<b_i\$
第三维\$c_j<c_i\$怎么办？用以\$c\$值建立权值树状数组维护即可。
具体流程为：

（1）递归处理\$[L,mid]\$与[mid+1,R]；
（2）以\$b\$为准则归并，其中：
（ 2>1 ）若为\$[L,mid]\$元素，将其\$c\$值插入权值树状数组
（ 2>2 ）若为\$[mid+1,R]\$元素，在权值线段树中查询小于其\$c\$值的元素个数。
（3）回溯;

观察到处理时，依旧满足上面\$CDQ\$分治的特性。
如果偏序原则中为\$\\leq\$即可，那么需要先去重。具体代码见这里

\$CDQ\$分治的写法

一个非常大的误区：\$CDQ\$分治一定要归并或边归并边处理。
这其实是不对的，上面说过，只要满足\$CDQ\$分治原则就可以称为\$CDQ\$分治。
所以\$CDQ\$分治的写法其实是多重多样，甚至不拘一格的。

B.CDQ分治中分治原则的确定

\$CDQ\$分治中的一个难点就是确定分治原则。
在我们分治前，我们会确定元素的分治多元组。
分治多元组的确定关键是看分治中对答案的影响因素。
下面给两个非常经典的例题：

例题3：

序列初始为空，接下来每次会在指定位置\$i\$插入一个元素\$x\$
求每次插入后，序列中的逆序对个数。
保证插入元素的值不重复，数据范围\$n \\leq 10^5\$

确定三元组\$(time , pos , val)\$，然后分治：
外部以\$time\$进行排序，消除\$time\$的影响。
然后内部以\$pos\$为原则进行归并，然后怎么处理呢？
考虑一下元素对答案的影响：
每次新增的点对此时答案的贡献为：
（1）插入时间比它早，位置在它前面，值比它大的元素。
（2）插入时间比它早，位置在它后面，值比它大的元素。
所以我们先以\$pos\$从小到大归并排序好。
然后从前往后正着扫一遍，
如果元素的\$time \\leq mid\$，那么在树状数组中插入它的\$val\$。
如果元素的\$time > mid\$，那么在树状数组中查询大于它的\$val\$的元素个数，加入答案。
然后再从后往前倒着扫一遍，处理方法一样。
这样我们最后就得到了每加入一个元素新增的贡献数，最后统计一下答案即可。
具体代码戳我。

例题4：

给定一个大小为\$n*n\$的矩阵，初始每个格子元素都为\$0\$
一共有\$10^5\$个操作，操作如下：
（1）type=1：x y val ,把(x,y)位置的元素加上val。
（2）type=2：x1 y1 x2 y2, 查询(x1,y1)到(x2,y2)这个矩形的元素和。

貌似是上面的例题1 的升级版....
由二维变为三维，怎么做呢？其实差不多。
二维前缀和之类的略，自己\$yy\$，然后：
建立三元组\$(time , x , y)\$
会影响询问答案的为：操作时间早于其，x、y都小于等于它x、y的修改操作
所以外部以\$time\$排序，然后以\$x\$为原则归并。
归并的时候，如果是左边区间的修改操作，把其修改值\$val\$值插入树状数组中的\$y\$位置。
如果是右边的查询操作，查询树状数组中小于等于其\$y\$值的元素值之和。
这题做完了......

C.\$CDQ\$分治的嵌套使用

1.解决四维偏序问题：

首先我们考虑三维偏序的解决方法：
外围排序三元组变为\$[L,b,c]与[R,b',c']\$，然后归并变为\$[L,L,c]与[R,R,c']\$
所以此时只需要在树状数组中查询\$c\$了。
那么四维是不是类似呢？
首先外围排序，四元组变为\$[L,b,c,d]与[R,b,c,d]\$
然后我们先以\$b\$为原则归并，但是并不统计答案。
此时我们要记录归并好的序列中每一个元素的\$a\$是属于\$L\$还是\$R\$。
那么此时只有\$b\$是有序的，\$a\$虽然无序但是我们记录了其来源（顺序）。
即此时的四元组为\$[L/R,L,c,d]\$与\$[L/R,R,c',d']\$
此时把这个新的序列带入下一层\$CDQ\$中再跑一遍，不就是三维偏序的处理吗？
但是这里注意，为了保证\$a\$的顺序，只有\$[L,L,c,d]\$与\$[R,R,c',d']\$的元素才是合法的。
这个也非常好解决，第一层\$CDQ\$归并时对每个元素打一个标记即可。
具体的代码见这里

2.解决N维偏序问题

这里提个醒，用嵌套\$CDQ\$解决\$N\$维偏序问题的复杂度是\$O(N\\ log^{N-1}N)\$的。
其实搞懂了四维偏序的解决方法后，五维、六维....不是一样的吗？
四维时我们打了一层标记，消除了一维的影响，最终变为了三维偏序问题。
那么\$N\$维我们则先归并\$N-3\$遍，打\$N-3\$层标记。
这样一共消除了\$N-3\$维的影响，然后再跑三维偏序即可。
实现五维偏序的具体代码见这里。