中位数及带权中位数问题

Posted clover_hxy

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了中位数及带权中位数问题相关的知识,希望对你有一定的参考价值。

信息学竞赛总是时不时与数学产生微妙的关系,中位数及带权中位数问题有时常常成为解题的关键,今日有时间,所以梳理一下。

先从一到简单的题看起:

士兵站队问题

在一个划分成网格的操场上,n个士兵散乱地站在网格点上。网格点由整数坐标(x,y)表示。士兵们可以沿网格边上、下、左、右移动一步,但在同一时刻任一网格点上只能有一名士兵。按照军官的命令,士兵们要整齐地列成一个水平队列,即排列成(x,y),(x+1,y),…,(x+n-1,y)。如何选择x和y的值才能使士兵们以最少的总移动步数排成一列。

分析:这个问题我们可以把X,Y分开看,两者互不影响。其实就是求所以横坐标的中点,也就是中位数,那么为什么呢?


我们可以把所选定的位置左右的两个点看成一对,只要所选位置在两者之间,那么长度恒等于两点的线性距离和,所以我们可以根据每一对不断缩小我们所选位置的范围,最后如果有奇数个点,那么就会在中间的那个点上,如果是偶数那么在中间两个数和他们所构成的区间,这样想就容易发现中位数这一规律了。

#include<iostream>
#include<cstdio>
#include<algorithm>
using namespace std;
int x[10010],y[10010];
int main()

	freopen("sol.in","r",stdin);
	freopen("sol.out","w",stdout);
	int n,i,sum=0,s;
	cin>>n;
	for (i=1;i<=n;i++)
	  scanf("%d%d",&x[i],&y[i]);
	sort(x+1,x+n+1);
	sort(y+1,y+n+1);
	s=y[(1+n)/2];
	for (i=1;i<=n;i++)
	  sum+=abs(y[i]-s);
	for (i=1;i<=n;i++)
	  x[i]-=i;
	sort(x+1,x+n+1);
	s=x[(1+n)/2];
	for (i=1;i<=n;i++)
	  sum+=abs(x[i]-s);
	cout<<sum<<endl;
	fclose(stdin);
	fclose(stdout);
	return 0;

再看看中位数与动归结合的应用:

[问题描述]

一些村庄被建在一条笔直的高速公路边上。我们用一条坐标轴来描述这条高速公路,每一个村庄的坐标都是整数。没有两个村庄坐标相同。两个村庄间的距离,定义为它们坐标值差的绝对值。

人们需要在一些村庄建立邮局——当然,并不是每一个村庄都必须建立邮局。邮局必须被建在村庄里,因此它的坐标和它所在的村庄坐标相同。每个村庄使用离它最近的那个邮局,建立这些邮局的原则是:所有村庄到各自所使用的邮局的距离总和最小。

你的任务是编写一个程序,在给定了每个村庄的坐标和将要建立的邮局数之后,按照上述原则,合理地选择这些邮局的位置。

输入文件的文件名是post.in

文件的第输入文件中同一行相邻两项之间用一个或多个空格隔开。

一行是包含两个整数:第一个整数是村庄的数目V,1〈=V〈=300,第二个整数是将建立的邮局数P,1〈=P〈=30且P〈=V。

文件的第二行按照递增顺序列出了V个整数。这V个整数分别表示了各村庄的位置坐标。对于每一个位置坐标X,1〈=X〈=10000。

输出文件名是post.out

文件的第一行是一个整数S,表示你所求出的所有村庄到离它最近邮局的距离的总和。

相应地,文件的第二行按照递增顺序列出了P个整数,分别表示你所求出每个邮局的建立位置。虽然对于同一个S,可能会有多种邮局建立的方案,但只需输出邮局位置尽量靠前的一组。

Example

Post.in

10   5

1 2 36 7 9 11 22 44 50

Post.out

9

2 7 2244 50 

这一道题是很经典的区间动态规划题,在预处理中就用到了上述思想。

#include<iostream>
#include<cstdio>
#include<cmath>
using namespace std;
int n,m,len[320][320],f[320][320],a[320],s[320][320],m1[320][320];
void print(int x,int y)

	if (x==0)
	 return;
	print(x-1,s[x][y]);
	printf("%d ",a[m1[s[x][y]+1][y]]);

int main()

	freopen("post.in","r",stdin);
	freopen("post.out","w",stdout);
	int i,j,k;
	scanf("%d%d",&n,&m);
	for (i=1;i<=n;i++)
	  scanf("%d",&a[i]);
	for (i=1;i<=n;i++)
	  for (j=i;j<=n;j++)
	    
	    	m1[i][j]=(i+j)/2;
	    	int temp1=0;
	    	for (k=i;k<=j;k++)
	    	  
	    	  	len[i][j]+=abs(a[k]-a[m1[i][j]]);
	    	  
	    	
	    
	memset(f,127,sizeof(f));
	for (i=1;i<=n;i++)
	  
	  	f[1][i]=len[1][i];
	  	s[1][i]=0;
	  
	for (i=2;i<=m;i++)
	  for (j=i;j<=n;j++)
	    for (k=i-1;k<=j-1;k++)
	       if (f[i][j]>f[i-1][k]+len[k+1][j])
	         
	         	f[i][j]=min(f[i][j],f[i-1][k]+len[k+1][j]);
	         	s[i][j]=k;
	         
	cout<<f[m][n]<<endl;
	print(m,n);
	return 0; 

中位数解决了,那么就来看一下带权中位数问题,这个问题如果不知道,一定会觉得某些题十分的高大上,无从下手。例如



典型的带权中位数问题,把平面转成线性即可。为何带权中位数问题就是就权值的中位数呢,我们可以这么想,不带权的相当于权为1,每个点只有一个人,那么带权就相当每个点有该点权值个人,这样理解就与上面的思路神合了 ps:证明过程 若最优点在T
则有:
∑D*DIST(I,T)(I<>T)<=∑D*DIST(I,T+1)(I<>T+1)
将此式化为:
∑D[L]*DIST(L,T)+∑D[R]*DIST(R,T)+D[T+1]*DIST(T+1,T)
<=∑D[L]*DIST(L,T+1)+∑D[R]*DIST(R,T+1)+D[T]*DIST(T,T+1) (L<T&R>T+1)
即:
∑D[L]*DIST(L,T+1)-∑D[L]*DIST(L,T)(L<T)+D[T]*(DIST(T,T+1))>=∑D[R]*DIST(R,T)-∑(D[R]*DIST(R,T+1))(R>T+1)+D[T+1]*(DIST(T,T+1))进一步化简为:
∑D[L]*(DIST(L,T)-DIST[L,T+1])(L<=T)<=∑D[R]*(DIST(R,T+1)-DIST(R,T))(R>=T+1)∵DIST(L,T)-DIST(L,T+1)=DIST(T,T+1)
DIST(R,T+1)-DIST(R,T)=DIST(T+1,T)
OBVIOUSLY : DIST(T,T+1)=DIST(T+1,T)
因此:
∑D[L](L<=T)>=∑(D[R])(R>=T+1)
即:∑D[L](L<T)+D[T]>=∑(D[R])(R>T)
因此我们发现,若T是最优点,则必有其左边的权值和加上D[T]后大于右边的权值和
而类似的,我们可以证明其右边的权值和加上D[T]后大于左边的权值和
因此我们要找的点也就是满足以上条件的点。
注意到此时我们的选择已经和具体的位置(坐标)没有关系了,而成为主要考虑因素的仅仅是各点上的权值。
因为左边的权值和数+D[T]>=右边的权值和,那么:
LEFTSUM+D[T]>=RIGHTSUM=SUMALL-(LEFTSUM+D[T])
=>2*(LEFTSUM+D[T])>=SUMALL
=>2*RIGHTSUM<=SUMALL
同理可得:
RIGHTSUM+D[T]>=LEFTSUM=SUMALL-(RIGHTSUM+D[T])
=>2*(RIGHTSUM+D[T])>=SUMALL
=>2*LEFTSUM<=SUMALL
此时我们发现:
2*LEFTSUM<=SUMALL 而 2*(LEFTSUM+D[T])>=SUMALL
也即是说当前的位置T上的数包含了第[(SUMALL)/2]个数,由开篇的简述可知,这第[(SUMALL)/2]个数,就是这个序列中的带权中位数。所以这一类问题,实质上就是带权中位数问题。
#include<iostream>
#include<cstdio>
#include<cstring>
#include<cmath>
#include<algorithm>
using namespace std;
struct data

 int x,y,w;
;data num[50003];
int n,i,j,k;
double sum,ans,xx,yy;
int xl,yl;
int cmp(data a,data b)

	return a.x<b.x;

int cmp1(data a,data b)

	return a.y<b.y;

int main()

	freopen("ball.in","r",stdin);
	freopen("ball.out","w",stdout);
	scanf("%d",&n);
	sum=ans=xx=yy=0;
	for (i=1;i<=n;i++)
	 
	 scanf("%d",&num[i].w);
	 sum+=num[i].w;
     
	for (i=1;i<=n;i++)
	 scanf("%d%d",&num[i].x,&num[i].y);
	sort(num+1,num+n+1,cmp);
    double mid=sum/2;
    for (i=1;i<=n;i++)
     
     	xx+=num[i].w;
     	if (xx>mid)
     	 
     	 	xl=num[i].x;
     	 	break;
     	 
     
    for (i=1;i<=n;i++)
     ans+=num[i].w*(abs(num[i].x-xl));
    sort(num+1,num+n+1,cmp1);
    for (i=1;i<=n;i++)
     
     	yy+=num[i].w;
     	if (yy>mid)
     	 
     	 	yl=num[i].y;
     	 	break;
     	 
     
    for (i=1;i<=n;i++)
     ans+=num[i].w*(abs(num[i].y-yl));
    printf("%0.2lf",ans);


以上是关于中位数及带权中位数问题的主要内容,如果未能解决你的问题,请参考以下文章

中位数及带权中位数题集

四边形不等式POJ1160[IOI2000]-Post Office

poj 1723 SOLDIERS 带权中位数

带权中位数

区间DP POJ1160村庄邮局问题

Putting Boxes Together CodeForces - 1030F (带权中位数)