视频解说:简易版二分查找

Posted 英雄哪里出来

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了视频解说:简易版二分查找相关的知识,希望对你有一定的参考价值。

点击我跳转末尾 获取 粉丝专属 《算法和数据结构》源码,以及获取博主的联系方式。

前言

  二分查找,又叫二分枚举是在一个单调有序的数组中查找某个元素的搜索算法。原理比较简单,基本说一遍就知道是怎么一回事。然而,实际过程中,很容易写错,比如:
  1)左区间是加一还是不加?
  2)右区间是减一还是不减?
  3)迭代的终止条件怎么写?
  4)为什么有时候会死循环?
  带着以上几个疑问,这篇文章将对二分查找的所有写法进行一个归纳总结。

一、线性枚举

1、线性枚举定义

  线性枚举指的就是遍历某个一维数组(顺序表)的所有元素,找到满足条件的那个元素并且返回,返回值可以是下标,也可以是元素本身。
  由于是遍历的,穷举了所有情况,所以一定是可以找到解的,一些资料上也称之为 暴力算法 (Brute Force)。接下来,我们通过一个例子来理解 线性枚举。

2、举例说明

  【例题1】给定一个单调不降的有序数组 a r r arr arr 和 一个值 x x x,要求找到大于 x x x 的最小数的下标。

3、算法分析

 我们从这个问题中提取几个关键字并分类如下:
  1)前提:单调不降、有序;
  2)条件:大于 x x x、最小数;
  3)返回结果:下标;

1)前提

  前提就是问题给定时的初始数组需要满足的先天性条件,保证数据是能够符合这个前提的。这里的前提是 数组一定是有序的,且是单调不降的,即 数组下标大的数 不会比 数组下标小的数 更小。

2)条件

  这个问题中的条件有两个:
  1)大于 x x x
  2)值最小;
  我们如果仔细分析一下这个问题,就可以发现,正因为这里的数组是单调不降的,所以,一旦满足 某个数大于 x x x,之后的所有数必然都满足 大于 x x x 这个条件。所以我们必然可以把数组分成两部分,一部分是 大于 x x x 的,另一部分是 不大于 x x x 的。

3)返回结果

  这里的返回结果要求是下标,而我们遍历操作也是通过遍历数组的下标进行的,所以找到满足条件的,返回下标即可。

4、画解枚举

  接下来,我们通过一组实际的数据来解释这个问题。
a r r = [ 1 , 3 , 4 , 6 , 6 , 6 , 7 , 8 , 9 ] arr = [1, 3, 4, 6, 6, 6, 7, 8, 9] arr=[1,3,4,6,6,6,7,8,9]

1)划分

  对于这个数组,当 x = 6 x = 6 x=6 时,我们将数组分成两部分,大于 6 的部分用 绿色表示,不大于 6 的部分用红色表示。
  这么表示的目的,主要是为了方便记忆,联想一下 红绿灯,绿色代表可以通行,即 “大于6” 这个条件满足;红色代表禁止通行,即条件不满足。

2)游标

  设定一个游标,初始时指向数组的第 0 个元素(C语言中数组下标从 0 开始计数)。
  游标,顾名思义,就是游动的下标。你也可以叫指针,我之所以没有称之为指针,是不想它和C语言中的指针概念混淆。

3)遍历

  遍历就是判断当前游标指向的元素是否是绿色的,如果是绿色的直接返回,因为它一定是大于 x x x 且值最小的;如果不是,则增加游标的值,继续下一次判断,直到数组遍历完毕。如下图所示:


  数字 7 就是我们要找到 大于 6 的最小数,它的下标为 6。

4)详解

int isGreen(int val, int x) {               // (1)
    return val > x;
}
int findFirstBiggerThan(int *arr, int arrSize, int x) {
    int i;
    for(i = 0; i < arrSize; ++i) {          // (2)
        if( isGreen(arr[i], x) ) {          // (3)
            return i;
        }
    }
    return arrSize;                         // (4)
}
  • ( 1 ) (1) (1) int isGreen(int val, int x)这个函数代表条件是否满足,满足返回 1,否则返回 0;这里的条件便是 v a l > x val > x val>x
  • ( 2 ) (2) (2) 下标从小到大,从 0 开始遍历数组 a r r arr arr
  • ( 3 ) (3) (3) 一旦遇到大于 x x x 的数,则返回它的下标,因为是下标从小往大遍历的,所以第一个找到满足条件的数一定是值最小的;
  • ( 4 ) (4) (4) 如果找不到,说明所有的数都是小于等于 x x x 的,直接返回数组长度;

5、举一反三

  接下来,我们来看看线性枚举的其它几种问法。

  【例题2】给定一个单调不降的有序数组如下: [ 1 , 3 , 4 , 6 , 6 , 6 , 7 , 8 , 9 ] [1, 3, 4, 6, 6, 6, 7, 8, 9] [1,3,4,6,6,6,7,8,9]。要求找到以下元素:
     ( 1 ) (1) (1) > 6 \\gt 6 >6 的 最小数 的下标位置;
     ( 2 ) (2) (2) ≥ 6 \\ge 6 6 的 最小数 的下标位置;
     ( 3 ) (3) (3) < 6 \\lt 6 <6 的 最大数 的下标位置;
     ( 4 ) (4) (4) ≤ 6 \\le 6 6 的 最大数 的下标位置;

   对于这四个问题,我们可以发现它们的答案如下所示:

012345678
134666789
( 3 ) (3) (3) ( 2 ) (2) (2) ( 4 ) (4) (4) ( 1 ) (1) (1)

1)大于 x x x 的最小数的下标

  将数组按照条件进行划分,然后利用上文提到的findFirstBiggerThan函数求解即可。

2)大于等于 x x x 的最小数的下标

  我们把问题做个变形,将问题变成找 大于等于 x x x 的最小数的下标(比之前的问题多了一个等于)。按照条件划分的结果应该是包含 6 本身的,所以如下图所示:


  遍历数组的部分不变,只不过条件变成了 大于等于。C语言实现如下:

int isGreen(int val, int x) {
    return val >= x;              // (1)
}
int findFirstBiggerEqualThan(int *arr, int arrSize, int x) {
    int i;
    for(i = 0; i < arrSize; ++i) {
        if( isGreen(arr[i], x) ) {
            return i;
        }
    }
    return arrSize;
}
  • ( 1 ) (1) (1) 将原先的>号改成>=即可;

3)小于 x x x 的最大数的下标

  上面两个问题能理解的话,我们再来看一个问题,如何找到 小于 x x x 的最大数的下标 ,要求下标最大,那么我们在枚举的过程中,如果发现一个大于等于 x x x 的数,那么后续都不用枚举了,并且需要返回这个数的前一个位置。条件划分如下图所示:

  我们要做的是返回红色中的最大下标,C语言实现如下:

int isGreen(int val, int x) {
    return val >= x;                  // (1)
} 

int findLastSmallThan(int *arr, int arrSize, int x) {
    int i;
    for(i = 0; i < arrSize; ++i) {
        if( isGreen(arr[i], x) ) {
            return i - 1;              
        }
    }
    return arrSize - 1;
}
  • ( 1 ) (1) (1) 大于等于 x x x 时,isGreen成立;
  • ( 2 ) (2) (2) 由于我们要做的是返回红色中的最大下标,所以一旦遇到大于等于 x x x 的数(即绿色的情况),则返回它的前一个下标;
  • ( 3 ) (3) (3) 如果找不到,则返回 arrSize - 1,即所有数都是红色的,则最大下标就是数组的最后一个元素的下标;

4)小于等于 x x x 的最大数的下标

  我们把问题继续做变形,将问题变成找 小于等于 x x x 的最大数的下标(比之前的问题多了一个等于)。划分如下图所示:

  遍历数组的部分不变,只不过条件变成了 大于,我们要做的是返回红色中的最大下标,C语言实现如下:

int isGreen(int val, int x) {
    return val > x;             // (1)
} 

int findLastSmallEqualThan(int *arr, int arrSize, int x) {
    int i;
    for(i = 0; i < arrSize; ++i) {
        if( isGreen(arr[i], x) ) {
            return i - 1;              
        }
    }
    return arrSize - 1;
}
  • ( 1 ) (1) (1) 将原先的>=号改成>即可;

6、时间复杂度

  以上的内容就是线性枚举的几种常见情况,也就是无脑遍历所有情况,并且在满足条件的第一时间退出循环,当数组长度为 n n n 时,算法的时间复杂度为 O ( n ) O(n) O(n),比较低效,有没有更加高效的算法呢?
  接下来出场的,就是本文的主角 —— 二分枚举。

二、二分枚举

1、二分枚举定义

  二分枚举,也叫二分查找,指的就是给定一个区间,每次选择区间的中点,并且判断区间中点是否满足某个条件,从而选择左区间继续求解还是右区间继续求解,直到区间长度不能再切分为止。
  由于每次都是把区间折半,又叫折半查找,时间复杂度为 O ( l o g 2 n ) O(log_2n) O(log2n),和线性枚举的求解结果一直,但是高效许多,返回值可以是下标,也可以是元素本身。

2、举例说明

  【例题3】只有两种颜色的数组 a r r arr arr ,左边部分为红色用 0 表示,右边部分为绿色用 1 表示,要求找到下标最小的绿色元素的下标。

如图所示,下标最小的绿色元素的下标为 3,所以应该返回 3。

3、算法分析

1)目标

  对于这个问题,当我们拿到这个数组的时候,第一个绿色位置在哪里,我们是不知道的,所以,现在的目标就是要通过二分枚举找到红色区域和绿色区域的边界。

2)游标

  利用线性枚举的思路,我们引入游标的概念,只不过需要两个游标,左边一个红色游标,右边一个绿色游标。并且游标初始位置都在数组以外,对于一个 n n n 个元素的数组,红色游标初始位置在 − 1 -1 1,绿色游标初始位置在 n n n

3)二分

  我们将两个游标相加,并且除 2,从而得到游标的中点,并且判断中点所在位置的颜色,发现是绿色的,这说明从 中点游标绿色游标 的元素都是绿色的。如下图所示:

  于是,我们可以把 绿色游标 替换成 中点游标,如下图所示:

  这样就完成了一次二分,区间相比之前,缩小了一半。注意,我们要求的解,一定永远在 红色游标绿色游标 之间。
  然后,我们继续将两个游标相加,并且除 2,从而得到游标的中点,并且判断中点所在位置的颜色,发现是红色的,这说明从 红色游标中点游标 的元素都是红色的。如下图所示:

  于是,我们可以把 红色游标 替换成 中点游标,如下图所示:

  同样上述算法,再经过两次二分以后,我们得到了如下结果:

  这个时候,这个时候 红色游标绿色游标 的位置一定相差 1,并且 绿色游标 的位置就是我们这个问题要求的解。

4)时间复杂度

  由于每次操作都是将区间减小一半,所以时间复杂度为 O ( l o g 2 n ) O(log_2n) O(log2n)

4、源码详解

  那么接下来,我们来看下,如何用 C语言来 实现这个问题。

1)条件判定

  判断一个元素是绿色还是红色,我们可以单独用一个函数来实现,根据题意,当值为 1 时代表绿色,值为 0 时代表红色,C语言实现如下:

int isGreen(int val) {
    return val == 1;
}

2)二分枚举模板

  接下来的二分枚举模板可以解决大部分二分枚举的问题,请妥善保管。

int binarySearch(int *arr, int arrSize, int x) {
    int l = -1, r = arrSize;         // (1)
    int mid;
    while(r - l > 1) {               // (2)
        mid = l + (r - l) / 2;       // (3)
        if( isGreen(arr[mid], x) )   // (4)
            r = mid;                 // (5)
        else
            l = mid;                 // (6)
    }
    return r;                        // (7)
}