数据流的中位数

Posted vector6_

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据流的中位数相关的知识,希望对你有一定的参考价值。

数据流的中位数

中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。

例如,

[2,3,4] 的中位数是 3

[2,3] 的中位数是 (2 + 3) / 2 = 2.5

设计一个支持以下两种操作的数据结构:

void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
示例:

addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3) 
findMedian() -> 2

对于使用排序的方法,无论数组或链表,时间复杂度都为O(n),而使用平衡二叉树(multiset)无法直接根据索引得到相应的值。这里使用两个优先级队列,一个大顶堆存放较小的那一半,一个小顶堆存放较大的那一半。需要同时维护这两个堆,使得两个堆中

1)元素数目相差不超过1

2)小顶堆堆顶元素总比大顶堆堆顶元素大

class MedianFinder 
public:
    MedianFinder() 

    
    
    void addNum(int num) 					//为了保证小顶堆堆顶元素总比大顶堆堆顶元素大,需要先向大顶堆加入元素,
        if(m_small.size()>=m_large.size())	//再把大顶堆的堆顶元素(即当前最大)取出再加入小顶堆,以保证元素数目相差不超过1
        
            m_small.push(num);
            int tmp = m_small.top();
            m_large.push(tmp);
            m_small.pop();
        
        else
        
            m_large.push(num);				//反之同样如此
            int tmp = m_large.top();
            m_small.push(tmp);
            m_large.pop();
        
    
    
    double findMedian() 					//根据总元素数目得到中位数
        if(m_small.size()<m_large.size())
        
            return m_large.top();
        
        else if(m_small.size()>m_large.size())
        
            return m_small.top();
        
        return (m_small.top()+m_large.top())/2.0;
    

    std::priority_queue<int, vector<int>, greater<int>> m_small;//大顶堆,存放较小的一半元素
    std::priority_queue<int, vector<int>, less<int>> m_large;	//小顶堆,存放较大的一半元素
;

/**
 * Your MedianFinder object will be instantiated and called as such:
 * MedianFinder* obj = new MedianFinder();
 * obj->addNum(num);
 * double param_2 = obj->findMedian();
 */

以上是关于数据流的中位数的主要内容,如果未能解决你的问题,请参考以下文章

E1. Send Boxes to Alice (Easy Version)

Codeforces1142D

mysql中 decimalnumeric数据类型

ABC三类网络子网数目与子网掩码的转换表

两个有序数组的中位数(第k大的数)

位深与色深