P1627 [CQOI2009]中位数 题解
Posted bifanwen
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了P1627 [CQOI2009]中位数 题解相关的知识,希望对你有一定的参考价值。
简要题意:
给定一个 (1) ~ (n) 的排列,求以 (b) 为中位数的 连续子序列且长度为奇数 的个数。
显然这段序列包含 (b).
中位数的定义:排序后在最中间的数。
算法一
对于 (30 \%) 的数据,(n leq 100).
由于这段序列一定包含 (b),那么我们可以枚举区间 ([i,j]) 包含 (b)(有类似于双指针),然后单独取出 ([i,j]) 这段进行排序,暴力判断即可。
时间复杂度:(O(n^3 log n)).
实际得分:(30pts).
算法二
对于 (60 \%) 的数据,(n leq 1000).
显然我们不需要每次都把 ([i,j]) 这段取出,可以一次次扩展。
比方说枚举 (i) (从 (d) 到 (1),(d) 是 (b) 的位置),然后枚举 (j) 从 (d) 到 (n). 对于每个 (j),只需在原来数组的基础上添上一个 (a_j) 即可;如果 (j=n) 的话,添加之后要把数组清空。
那么每次只需要插入一个数的话,我们可以用 插入排序,因为已经排序的是有序的,因为插入的位置可以用二分算出。插入操作我们不用数组维护,用 ( ext{vector}) 维护会方便很多。
时间复杂度:(O(n^2 log n)).
实际得分:(60pts).
算法三
对于 (60 \%) 的数据,(n leq 1000).
抛开排序过程,我们想:因为排列的性质,不存在重复数。所以,一个连续序列的中位数为 (b) 当且仅当比 (b) 大的数的个数和比 (b) 小的数的个数相等。 那么,对于 (d) 的左边,线性 ( ext{dp}) ,用 (f_i) 表示 (i) ~ (d) 比 (i) 大的数的个数,(g_i) 是小的,同理 (d) 的右边也推一遍。
那么,我们枚举左右端点 (i,j) 只需要 (O(1)) 判断即可。即 (f_i + g_i = f_j + g_j).
时间复杂度:(O(n^2)).
实际得分:(60pts).
算法四
对于 (60 \%) 的数据,(n leq 1000).
从算法三的 ( ext{dp}) 上入手,我们发现,(f_i + g_i = f_j + g_j) 等价于 (f_i - f_j = g_i - g_j). 所以我们只需要算出 比 (b) 大的数的个数与比 (b) 小的数的个数之差 重新作为 (f) 数组的状态,然后枚举端点即可。
时间复杂度:(O(n^2)).
实际得分:(60pts).
算法五
对于 (100 \%) 的数据,(n leq 10^5).
从算法四上再优化一下,其实对于固定的一个左端点 (i),我们只需要算出有多少个 (j geq d) 且 (f_i = f_j) 即可。
也就是说,我们需要维护 区间查询相等个数。
智商不够,数据结构来凑。所以这个查询我们可以用 ( ext{Treap}) 或者 ( ext{Splay}) 来实现。(随便用个平衡树板子都能实现的)
时间复杂度:(O(n log n)).
实际得分:(100pts).
算法六
对于 (100 \%) 的数据,(n leq 10^5).
从算法五上入手,你发现 区间查询相等个数 是静态查询,不需要修改。那你可以用 权值线段树(主席树) 解决本题。
时间复杂度:(O(n log n)).
实际得分:(100pts).
算法七
对于 (100 \%) 的数据,(n leq 10^5).
在算法六的基础上,你发现不仅是静态,而且是固定的一个区间 ([d,n]). 那么我们不需要用 权值线段树(可以理解为 (n) 棵线段树),只需要 (1) 棵线段树即可。
时间复杂度:(O(n log n)).
实际得分:(100pts).
算法八
对于 (100 \%) 的数据,(n leq 10^5).
如果你的程序在算法七止步不前,只能说明你是个天才,离最后的成功只差几步了。
固定区间维护静态相等个数,听上去很高大上啊,其实不就是个 ( ext{map}) 吗?
某同学:我还能 %$#^%*(%&))
嗯,改成 ( ext{map}) 之后感觉简单多了,是不是?然后我们直接省去 (f) 数组,直接存入 ( ext{map}).
时间复杂度:(O(n log n)).
实际得分:(100pts).
//为了看起来清晰 , 用了嵌套三目运算符
// q[tot+=((a[i]>b)?1:(a[i]<b)?-1:0)]++; 其实相当于这几句:
// if(a[i]>b) tot++;
// if(a[i]<b) tot--;
// q[tot]++;
#pragma GCC optimize(2)
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
const int N=1e5+1;
inline int read(){char ch=getchar();int f=1;while(ch<‘0‘ || ch>‘9‘) {if(ch==‘-‘) f=-f; ch=getchar();}
int x=0;while(ch>=‘0‘ && ch<=‘9‘) x=(x<<3)+(x<<1)+ch-‘0‘,ch=getchar();return x*f;}
int n,b,wz,a[N];
int tot,sum; ll ans=0;
map<int,int> q;
int main(){
n=read(),b=read();
for(int i=1;i<=n;i++) a[i]=read(),wz=(a[i]==b)?i:wz;
for(int i=wz;i<=n;i++) q[tot+=((a[i]>b)?1:(a[i]<b)?-1:0)]++;
for(int i=wz;i>=1;i--) ans+=q[0-(sum+=(a[i]>b)?1:((a[i]<b)?-1:0))];
printf("%lld
",ans);
return 0;
}
算法九
对于 (200 \%) 的数据,(n leq 10^7).
(实际上是本人的一个加强)
算法八的基础上,我们可以尝试拿掉这个 (log).
但是你很快发现下标虽然不超过 (10^7),但是会有负数,可能有 (-10^7).
显然,哈希处理负下标 是这题的最终正解。
把每个下标都加上 (n),解决负下标之后 (O(1)) 查询,拿掉 ( ext{map}) 还解决了 (log).
时间复杂度:(O(n)).
实际得分:(200pts).
以上是关于P1627 [CQOI2009]中位数 题解的主要内容,如果未能解决你的问题,请参考以下文章