不用排序怎样快速找到中位数，最好是一遍下来得到结果，求算法或者思路谢谢！

Posted 2023-03-09

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了不用排序怎样快速找到中位数，最好是一遍下来得到结果，求算法或者思路谢谢！相关的知识，希望对你有一定的参考价值。

几十万个数字，不用排序怎样快速找到中位数，最好是一遍下来得到结果，求算法或者思路谢谢！

这个比较不好讲清楚，先假设 A 和 B 都是升序的。

这个问题的关键在于给定 k，怎样找到 A 和 B 合并后的第 k 大元素。我们可以这样做：

1. 把 A 平均分为前后两个部分，前部分有 x 个元素，后部分有 n1-x 个元素（由于 A 是有序的，所以后一部分的所有元素大于前一部分）。A[x] = A的后一部分的第一个元素。
2. 同理把 B 也平均分成前后两个部分，前部分有 y 个元素，后部分有 n2-y 个元素。B[y] = B的后一部分的第一个元素。
3. 由于两个数组都是被平均分割的，所以可以近似地认为 x = n1/2, y = n2/2。

这里不妨设 A[x] <= B[y]（如果 A[x] > B[y] 处理过程和下面类似）：

=============================== 情况1 ============================

由于在 A 中，A[x] 前面有 x 个元素，在 B 中，B[y] 前面有 y 个元素，并且又有 A[x] <= B[y]，那么，合并以后，A[x]前面原来那些元素必然也在B[y]前面，也就是说，B[y]前面至少会有 x + y 个元素，我们再规定如果 A, B 中有相同元素，则合并后 A 中的元素排在 B 前面，那么归并以后 A[x] 也会排在 B[y] 前面，于是乎合并之后 B[y] 至少有 x+y+1 个元素。

如果 k <= x+y+1，也就是说，合并后第 k 大的元素必然落在 B[y] 前面。所以，原来在 B 数组中，第二部分（B[y]以及 B[y] 之后）那些元素都不可能包含我们要找到内容（第 k 大元素），所以我们可以把他们排除掉。这样就排除了 B 中一半的内容。

=============================== 情况2 ============================

在 A 中，A[x] 及其后面有 n1-x 个元素，除去 A[x] 之后有 n1-x-1 个元素，B[y] 及其后面有 n2-y 个元素。那么，由于 A[x] <= B[y]，所以合并起来之后，B[y] 后面那些元素必然也在 A[x] 后面，则合并后 A[x] 后面至少有 (n1-x-1) + (n2-y) = (n1+n2)-(x+y+1) 个元素。

如果 k > x+y+1，也就说，合并后第 k 大的元素必然落在 A[x] 后面。所以，原来在 A 数组中，第一部分（A[x]之前）以及 A[x] 都不可能包含我们要找的元素，所以我们可以把他们排除掉。这样就排除了 A 中一半的内容。

============================ 下面是总结 ===========================

综上所诉，对于 k <= x+y+1 还是 k > x+y+1 我们都提出了解决的方案，并且每种方案都能把 A 或者 B 的规模减小一半。减小了一半之后，我们将其作为一个新的问题继续使用上面的算法处理，直到 A 或者 B 减小到足够小：

1. A没有了，这样只需要找出 B 中第 k 大的元素，也就是 B[k].
2. B没有了，同上结果就是 A[k].

达到以上两个条件的任意一个分别只需要 O(logn1) 和 O(logn2) 的时间，所以最坏情况下这个算法只需要 O(logn1 + logn2) 就能得出结果。

============================ 下面是程序 ===========================

以下是基于这个算法的程序，具体实现是在 element_at 这个函数中，通过调用 element_at(0, n1-1, 0, n2-1, k) 可返回 A, B 数组合并后第 k 大的元素。

#include <stdio.h>

int n1, n2;
int A[1000];
int B[1000];

int element_at(int l1, int r1, int l2, int r2, int k)
int x = (l1 + r1) / 2, y = (l2 + r2) / 2;

if (l1 > r1) return B[l2+k-1];
if (l2 > r2) return A[l1+k-1];

if (A[x] <= B[y])
if (k <= (x - l1) + (y - l2) + 1)
return element_at(l1, r1, l2, y-1, k);
else
return element_at(x+1, r1, l2, r2, k-(x-l1)-1);

else
if (k <= (x - l1) + (y - l2) + 1)
return element_at(l1, x-1, l2, r2, k);
else
return element_at(l1, r1, y+1, r2, k-(y-l2)-1);

return 0;

int main()
int i;
printf("请输入A的大小：");
scanf("%d", &n1);
printf("请输入%d个数，以空格隔开：",n1);
for (i = 0; i < n1; i++) scanf("%d", &A[i]);

printf("请输入B的大小：");
scanf("%d", &n2);
printf("请输入%d个数，以空格隔开：",n2);
for (i = 0; i < n2; i++) scanf("%d", &B[i]);

if ((n1 + n2) & 1)
printf("中位数是：%d\n", element_at(0, n1-1, 0, n2-1, (n1+n2)/2+1));
else
printf("中位数是：%lf\n", (element_at(0, n1-1, 0, n2-1, (n1+n2)/2) + element_at(0, n1-1, 0, n2-1, (n1+n2)/2+1)) / 2.0);

return 0;
追问

谢谢你的回答，你说的现在是 A 和 B 数组是有序的情况！现在主要他们都是无序的呀！我可以吧这些数分成A B 两个数组但是不能保证A B 的顺序和大小是多少！这个怎么考虑！谢谢！

参考技术A 比如 1-9 这9个数字的中位数是 5

这些数的和是 45
temp = 5*0.618=3.09
比如现在的顺序是 189234675
然后 temp每次修正　temp= temp * n/2(n-m) n是数组个数 m 是小于 temp 的个数
一遍下来 big = 8,9,4,6,7,5
samll = 1,2,3
现在修正 temp = 3.09*9/6 =4.635

一遍下来 big = 8,9,6,7,5
samll = 1,2,3,4
temp = 4.635*9/8=5.214375

一遍下来 big = 8,9,6,7
samll = 1,2,3,4,5
temp = 5.214375 * 9/8

边界是 count(big) - count(samll) < =1
这样最后可以得到中位数但是效率
不高

用的原来就是中位数的大于他的和小于他的个数一样

对应算法是 search_zhong.php

<?php
$arr = array();//定义数组
for($i=0;$i<=1000;$i++)//假设有 1001个数字现在随机生成
$arr[] = rand(0,10000);

$arr_s = $arr;
$time = time();//排序前开始计时
sort($arr);//对数组排序

$zhongwei = $arr[501];//中位数
echo '中位数是：'.$zhongwei.'找到中位数用了'.time()-$time.'秒
';
$time2 = time();

echo '中位数是：(用马乙说的方法)'.mayiFunc($arr_s,0,0).'找到中位数用了'.time()-$time2.'秒
';

function mayiFunc($arr,$temp,$m)
$n = count($arr);
if($temp == 0)
$sum = array_sum($arr);
$agv = $sum/count($arr);
$temp = $agv*0.618;
else
$temp = $temp * $n/(2*($n-$m));

$big = array();
$small = array();
foreach($arr as $a)
if($a>$temp)
$big++;

else
$small++;

if($big>$small)
if($big-$small<=1)
echo $temp;
exit;
return $temp;

else
mayiFunc($arr,$temp,$small);//迭代调用

else
if($small-$big<=1)
echo $temp;
exit;
return $temp;

else
mayiFunc($arr,$temp,$big);//迭代调用

这样感觉效率还是不高！本回答被提问者采纳参考技术B 所有数相加，在除以2，奇数的话就把相加结果加一在除以2。
望采纳参考技术C 如果是几十万个正整数的话，可以构造一个数组，数组的长度是数据中的最大值。假设为array[max]，数组置零。
遍历所有数字n，令array[n]+=1。
遍历array，sun+=array[i]，若sun>=length/2，终止遍历，i即为中位数。
可能直接无法构造巨大的数组，那就用树来构造一个参考技术D 如果你了解快速排序的话，用一下方法可以实现。
首先把问题转化为求一列数中第i小的数的问题，求中位数就是求一列数的第（length/2+1）小的数的问题。
然后调用快速排序中的partition函数q=partition(A,0,lenght);
1--q>length/2，那就调用A[q=partition(A,0,q-1)];
2--q=lengh/2,return A[q];//找到
3--q<length/2,调用A[q=partition(A,q+1,length,length/2-q+1)];
以上默认此序列长度为奇数，如果为偶数就是第调用上述方法两次找到中间的两个数求平均。

以上是关于不用排序怎样快速找到中位数，最好是一遍下来得到结果，求算法或者思路谢谢！的主要内容，如果未能解决你的问题，请参考以下文章

不用排序怎样快速找到中位数，最好是一遍下来得到结果，求算法或者思路 谢谢！

不用排序怎样快速找到中位数，最好是一遍下来得到结果，求算法或者思路谢谢！