如何理解"我们有成熟的时间复杂度为O(n)的算法得到数组中任意第k大的数"

Posted yudidi

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何理解"我们有成熟的时间复杂度为O(n)的算法得到数组中任意第k大的数"相关的知识,希望对你有一定的参考价值。

在剑指offer第2版"面试题39:数组中出现次数超过一半的数字"的题解中,有这么一句话:
"我们有成熟的时间复杂度为O(n)的算法得到数组中任意第k大的数字",
我觉得这句话有点不妥,至少让我产生过误解。

go代码如下:

func partition(nums []int, l, r int) int {
    // 1. 哨兵 取第一个元素
    v := nums[l]
    // 2. 大小分区的定义和初始化 [l+1,p]<v && [p+1,cur-1]>v 
    p := l
    // 3. 处理哨兵之后的每一个元素
    cur := l + 1
    for ; cur <= r; cur++ {
        if nums[cur] < v {
            nums[cur], nums[p+1] = nums[p+1], nums[cur]
            p++
        }
    }
    nums[p], nums[l] = nums[l], nums[p] // 哨兵和小分区的最后一个元素交换,使得哨兵左边是小的,右边是大的.
    return p
}

partion代码的时间复杂度是O(n),因为需要通过for循环把每个数都划分到大分区或小分区中。

但是,每次partition我们能够获取到哪个数的排序后位置,我们是不能指定的。所以,我们需要进行多次partition操作,直到我们选择的哨兵恰好是那个第k大的数字,这样我们才能获取到"第k大"的数字。最坏的情况下,我们可能需要调用n次partition,那么最坏的时间复杂度就是n*O(n),而不是O(n)。

剑指offer中的表述容易让我们误解为: 只需要调用一次partition就能找到第k大的数,这应该是个概率事件,发生的概率是1/n(只有当第k大的数字恰好被选为哨兵的情况下才成立,而第k大数字被选为哨兵的概率为1/n)。实际情况是,我需要调用多次partition才能找到第k大的数。

另外,还有以下这些算法题涉及了partition函数的运用,他们的共同特点都是需要用partition查找xxx位置的数字。

  1. Majority Element(本博客讨论的题) : partition查找m位置的数(中位数:索引为n/2)
  2. Kth Largest Element in an Array : partiton查找k位置的数
  3. 剑指offer面试题40:最小的k个数 : partiton查找k位置的数,但是只返回k位置左边的数,也就是小于哨兵的那些数

欢迎讨论,语言不限, 我依次从事过.Net,Java,python,Go语言的研发工作,嘿嘿。

虽然我面向面试刷题,但是我确实数次被算法发明者的智慧所深深折服,真的牛逼。。。

以上是关于如何理解"我们有成熟的时间复杂度为O(n)的算法得到数组中任意第k大的数"的主要内容,如果未能解决你的问题,请参考以下文章

渐进复杂度的定义

时间为O(nlg n)的排序算法 如快速排序 堆排序 nlg是啥意思。好象是lgn。 啥意思?

构建堆的时间复杂度如何是 O(n)?

我们如何在 O(n) 时间和 O(1) 空间复杂度内找到数组中的重复数字

我如何准确识别O(nlogn)?

IF 如何影响复杂性?