剑指Offer对答如流系列 - 数据流中的中位数

Posted jefferychenxiao

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了剑指Offer对答如流系列 - 数据流中的中位数相关的知识,希望对你有一定的参考价值。

面试题41:数据流中的中位数

题目描述

如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。

所谓数据流,就是不会一次性读入所有数据,只能一个一个读取,每一步都要求能计算中位数。

问题分析

相信上一道题 最小的k个数 给了你容器的启示。

我们将读入的数据分为两部分,一部分数字小,另一部分大。

小的一部分采用大顶堆存放,大的一部分采用小顶堆存放。当总个数为偶数时,使两个堆的数目相同,则中位数=大顶堆的最大数字与小顶堆的最小数字的平均值;而总个数为奇数时,使小顶堆的个数比大顶堆多一,则中位数=小顶堆的最小数字。

关于插入,我们需要好好思量思量:

  1. 假如已读取的个数为偶数(包括0)时,两个堆的数目已经相同,一般将新读取的数插入到小顶堆中,从而实现小顶堆的个数多一。但是,如果新读取的数字比大顶堆中最大的数字还小,要将新数字插入到大顶堆中,并且将大顶堆中的最大数字插入到小顶堆中,从而实现小顶堆的个数多一。
  2. 若已读取的个数为奇数时,小顶堆的个数多一,一般要将新读取数字插入到大顶堆中,但是的处理方法与上面类似。

拓展一下:最大最小堆可以用PriorityQueue实现,PriorityQueue默认是一个小顶堆,通过传入自定义的Comparator函数可以实现大顶堆:

PriorityQueue<Integer> maxHeap = new PriorityQueue<Integer>(11,new Comparator<Integer>(){ //大顶堆,容量11
    @Override
    public int compare(Integer i1,Integer i2){
        return i2-i1; //降序排列
    }
});

PriorityQueue是JDK内置的,想多点了解可以参考【JDK源码剖析】Queue--队列 PriorityQueue--优先队列

问题解答

    PriorityQueue<Integer> minHeap = new PriorityQueue<>(); //小顶堆,默认容量为11
    PriorityQueue<Integer> maxHeap = new PriorityQueue<>(11,new Comparator<Integer>(){ //大顶堆,容量11
        public int compare(Integer i1,Integer i2){
            return i2-i1;
        }
    });

    public void Insert(Integer num) {
        if(((minHeap.size()+maxHeap.size())&1 )==0){
            //偶数时,下个数字加入小顶堆
            if(!maxHeap.isEmpty() && maxHeap.peek() > num){
                maxHeap.offer(num);
                num=maxHeap.poll();
            }
            minHeap.offer(num);
        } else {
            //奇数时,下一个数字放入大顶堆
            if(!minHeap.isEmpty() && minHeap.peek() < num){
                minHeap.offer(num);
                num=minHeap.poll();
            }
            maxHeap.offer(num);
        }
    }

    // 获取以有的数据的中位数
    public Double GetMedian() {
        if((minHeap.size()+maxHeap.size())==0) {
            throw new RuntimeException();
        }
        double median;
        if((minHeap.size()+maxHeap.size()&1)==0){
            median=(maxHeap.peek()+minHeap.peek())/2.0;
        }else{
            median=minHeap.peek();
        }
        return median;
    }

以上是关于剑指Offer对答如流系列 - 数据流中的中位数的主要内容,如果未能解决你的问题,请参考以下文章

剑指Offer对答如流系列 - 数字序列中某一位的数字

剑指Offer对答如流系列 - 数组中的逆序对

剑指Offer对答如流系列 - 复杂链表的复制

剑指Offer对答如流系列 - 构建乘积数组

剑指Offer对答如流系列 - 合并两个排序的链表

剑指Offer对答如流系列 - 圆圈中最后剩下的数字