视频解说：简易版二分查找

Posted 2021-11-06 英雄哪里出来

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了视频解说：简易版二分查找相关的知识，希望对你有一定的参考价值。

点击我跳转末尾 获取 粉丝专属 《算法和数据结构》源码，以及获取博主的联系方式。

前言

二分查找，又叫二分枚举是在一个单调有序的数组中查找某个元素的搜索算法。原理比较简单，基本说一遍就知道是怎么一回事。然而，实际过程中，很容易写错，比如：
1）左区间是加一还是不加？
2）右区间是减一还是不减？
3）迭代的终止条件怎么写？
4）为什么有时候会死循环？
带着以上几个疑问，这篇文章将对二分查找的所有写法进行一个归纳总结。

一、线性枚举

1、线性枚举定义

线性枚举指的就是遍历某个一维数组（顺序表）的所有元素，找到满足条件的那个元素并且返回，返回值可以是下标，也可以是元素本身。
由于是遍历的，穷举了所有情况，所以一定是可以找到解的，一些资料上也称之为暴力算法（Brute Force）。接下来，我们通过一个例子来理解线性枚举。

2、举例说明

【例题1】给定一个单调不降的有序数组 $a r r$ 和一个值 $x$ ，要求找到大于 $x$ 的最小数的下标。

3、算法分析

我们从这个问题中提取几个关键字并分类如下：
1）前提：单调不降、有序；
2）条件：大于 $x$ 、最小数；
3）返回结果：下标；

1）前提

前提就是问题给定时的初始数组需要满足的先天性条件，保证数据是能够符合这个前提的。这里的前提是数组一定是有序的，且是单调不降的，即 数组下标大的数 不会比 数组下标小的数 更小。

2）条件

这个问题中的条件有两个：
1）大于 $x$ ；
2）值最小；
我们如果仔细分析一下这个问题，就可以发现，正因为这里的数组是单调不降的，所以，一旦满足 某个数大于 $x$ ，之后的所有数必然都满足 大于 $x$ 这个条件。所以我们必然可以把数组分成两部分，一部分是 大于 $x$ 的，另一部分是 不大于 $x$ 的。

3）返回结果

这里的返回结果要求是下标，而我们遍历操作也是通过遍历数组的下标进行的，所以找到满足条件的，返回下标即可。

4、画解枚举

接下来，我们通过一组实际的数据来解释这个问题。
$a r r = [1, 3, 4, 6, 6, 6, 7, 8, 9]$

1）划分

对于这个数组，当 $x = 6$ 时，我们将数组分成两部分，大于 6 的部分用绿色表示，不大于 6 的部分用红色表示。
这么表示的目的，主要是为了方便记忆，联想一下 红绿灯，绿色代表可以通行，即 “大于6” 这个条件满足；红色代表禁止通行，即条件不满足。

2）游标

设定一个游标，初始时指向数组的第 0 个元素（C语言中数组下标从 0 开始计数）。
游标，顾名思义，就是游动的下标。你也可以叫指针，我之所以没有称之为指针，是不想它和C语言中的指针概念混淆。

3）遍历

遍历就是判断当前游标指向的元素是否是绿色的，如果是绿色的直接返回，因为它一定是大于 $x$ 且值最小的；如果不是，则增加游标的值，继续下一次判断，直到数组遍历完毕。如下图所示：

数字 7 就是我们要找到大于 6 的最小数，它的下标为 6。

4）详解

int isGreen(int val, int x) {               // (1)
    return val > x;
}
int findFirstBiggerThan(int *arr, int arrSize, int x) {
    int i;
    for(i = 0; i < arrSize; ++i) {          // (2)
        if( isGreen(arr[i], x) ) {          // (3)
            return i;
        }
    }
    return arrSize;                         // (4)
}

$(1)$ int isGreen(int val, int x)这个函数代表条件是否满足，满足返回 1，否则返回 0；这里的条件便是 $v a l > x$ 。
$(2)$ 下标从小到大，从 0 开始遍历数组 $a r r$ ；
$(3)$ 一旦遇到大于 $x$ 的数，则返回它的下标，因为是下标从小往大遍历的，所以第一个找到满足条件的数一定是值最小的；
$(4)$ 如果找不到，说明所有的数都是小于等于 $x$ 的，直接返回数组长度；

5、举一反三

接下来，我们来看看线性枚举的其它几种问法。

【例题2】给定一个单调不降的有序数组如下： $[1, 3, 4, 6, 6, 6, 7, 8, 9]$ 。要求找到以下元素：
$(1)$ $\\gt 6$ 的最小数的下标位置；
$(2)$ $\\ge 6$ 的最小数的下标位置；
$(3)$ $\\lt 6$ 的最大数的下标位置；
$(4)$ $\\le 6$ 的最大数的下标位置；

对于这四个问题，我们可以发现它们的答案如下所示：

0	1	2	3	4	5	6	7	8
1	3	4	6	6	6	7	8	9
		$(3)$	$(2)$		$(4)$	$(1)$

1）大于 $x$ 的最小数的下标

将数组按照条件进行划分，然后利用上文提到的findFirstBiggerThan函数求解即可。

2）大于等于 $x$ 的最小数的下标

我们把问题做个变形，将问题变成找 大于等于 $x$ 的最小数的下标（比之前的问题多了一个等于）。按照条件划分的结果应该是包含 6 本身的，所以如下图所示：

遍历数组的部分不变，只不过条件变成了 大于等于。C语言实现如下：

int isGreen(int val, int x) {
    return val >= x;              // (1)
}
int findFirstBiggerEqualThan(int *arr, int arrSize, int x) {
    int i;
    for(i = 0; i < arrSize; ++i) {
        if( isGreen(arr[i], x) ) {
            return i;
        }
    }
    return arrSize;
}

$(1)$ 将原先的>号改成>=即可；

3）小于 $x$ 的最大数的下标

上面两个问题能理解的话，我们再来看一个问题，如何找到 小于 $x$ 的最大数的下标 ，要求下标最大，那么我们在枚举的过程中，如果发现一个大于等于 $x$ 的数，那么后续都不用枚举了，并且需要返回这个数的前一个位置。条件划分如下图所示：

我们要做的是返回红色中的最大下标，C语言实现如下：

int isGreen(int val, int x) {
    return val >= x;                  // (1)
} 

int findLastSmallThan(int *arr, int arrSize, int x) {
    int i;
    for(i = 0; i < arrSize; ++i) {
        if( isGreen(arr[i], x) ) {
            return i - 1;              
        }
    }
    return arrSize - 1;
}

$(1)$ 大于等于 $x$ 时，isGreen成立；
$(2)$ 由于我们要做的是返回红色中的最大下标，所以一旦遇到大于等于 $x$ 的数（即绿色的情况），则返回它的前一个下标；
$(3)$ 如果找不到，则返回 arrSize - 1，即所有数都是红色的，则最大下标就是数组的最后一个元素的下标；

4）小于等于 $x$ 的最大数的下标

我们把问题继续做变形，将问题变成找 小于等于 $x$ 的最大数的下标（比之前的问题多了一个等于）。划分如下图所示：

遍历数组的部分不变，只不过条件变成了大于，我们要做的是返回红色中的最大下标，C语言实现如下：

int isGreen(int val, int x) {
    return val > x;             // (1)
} 

int findLastSmallEqualThan(int *arr, int arrSize, int x) {
    int i;
    for(i = 0; i < arrSize; ++i) {
        if( isGreen(arr[i], x) ) {
            return i - 1;              
        }
    }
    return arrSize - 1;
}

$(1)$ 将原先的>=号改成>即可；

6、时间复杂度

以上的内容就是线性枚举的几种常见情况，也就是无脑遍历所有情况，并且在满足条件的第一时间退出循环，当数组长度为 $n$ 时，算法的时间复杂度为 $O (n)$ ，比较低效，有没有更加高效的算法呢？
接下来出场的，就是本文的主角 —— 二分枚举。

二、二分枚举

1、二分枚举定义

二分枚举，也叫二分查找，指的就是给定一个区间，每次选择区间的中点，并且判断区间中点是否满足某个条件，从而选择左区间继续求解还是右区间继续求解，直到区间长度不能再切分为止。
由于每次都是把区间折半，又叫折半查找，时间复杂度为 $O(log_2n)$ ，和线性枚举的求解结果一直，但是高效许多，返回值可以是下标，也可以是元素本身。

2、举例说明

【例题3】只有两种颜色的数组 $a r r$ ，左边部分为红色用 0 表示，右边部分为绿色用 1 表示，要求找到下标最小的绿色元素的下标。

如图所示，下标最小的绿色元素的下标为 3，所以应该返回 3。

3、算法分析

1）目标

对于这个问题，当我们拿到这个数组的时候，第一个绿色位置在哪里，我们是不知道的，所以，现在的目标就是要通过二分枚举找到红色区域和绿色区域的边界。

2）游标

利用线性枚举的思路，我们引入游标的概念，只不过需要两个游标，左边一个红色游标，右边一个绿色游标。并且游标初始位置都在数组以外，对于一个 $n$ 个元素的数组，红色游标初始位置在 $- 1$ ，绿色游标初始位置在 $n$ 。

3）二分

我们将两个游标相加，并且除 2，从而得到游标的中点，并且判断中点所在位置的颜色，发现是绿色的，这说明从 中点游标 到 绿色游标 的元素都是绿色的。如下图所示：

于是，我们可以把 绿色游标 替换成 中点游标，如下图所示：

这样就完成了一次二分，区间相比之前，缩小了一半。注意，我们要求的解，一定永远在 红色游标 和 绿色游标 之间。
然后，我们继续将两个游标相加，并且除 2，从而得到游标的中点，并且判断中点所在位置的颜色，发现是红色的，这说明从 红色游标 到 中点游标 的元素都是红色的。如下图所示：

于是，我们可以把 红色游标 替换成 中点游标，如下图所示：

同样上述算法，再经过两次二分以后，我们得到了如下结果：

这个时候，这个时候 红色游标 和 绿色游标 的位置一定相差 1，并且 绿色游标 的位置就是我们这个问题要求的解。

4）时间复杂度

由于每次操作都是将区间减小一半，所以时间复杂度为 $O(log_2n)$ 。

4、源码详解

那么接下来，我们来看下，如何用 C语言来实现这个问题。

1）条件判定

判断一个元素是绿色还是红色，我们可以单独用一个函数来实现，根据题意，当值为 1 时代表绿色，值为 0 时代表红色，C语言实现如下：

int isGreen(int val) {
    return val == 1;
}

2）二分枚举模板

接下来的二分枚举模板可以解决大部分二分枚举的问题，请妥善保管。

int binarySearch(int *arr, int arrSize, int x) {
    int l = -1, r = arrSize;         // (1)
    int mid;
    while(r - l > 1) {               // (2)
        mid = l + (r - l) / 2;       // (3)
        if( isGreen(arr[mid], x) )   // (4)
            r = mid;                 // (5)
        else
            l = mid;                 // (6)
    }
    return r;                        // (7)
}

$以上是关于视频解说：简易版二分查找的主要内容，如果未能解决你的问题，请参考以下文章视频解说：二分查找通用模板英语学习工具学习英语硬背硬记太难了, 在这里解说 LeHoCat 提供免费的视频集工具的使用方法, 看视频学英语的工具, 制作英语教学课件的工具, 帮助自学英语（详细图文）第2版查找史上最简单清晰的红黑树解说二分查找无废话版总结一百行代码实现简易版 ChatGPT | 社区征文二分查找算法(Python版)$

视频解说：简易版二分查找

前言

文章目录

一、线性枚举

1、线性枚举定义

2、举例说明

3、算法分析

1）前提

2）条件

3）返回结果

4、画解枚举

1）划分

2）游标

3）遍历

4）详解

5、举一反三

1）大于 x x x 的最小数的下标

2）大于等于 x x x 的最小数的下标

3）小于 x x x 的最大数的下标

4）小于等于 x x x 的最大数的下标

6、时间复杂度

二、二分枚举

1、二分枚举定义

2、举例说明

3、算法分析

1）目标

2）游标

3）二分

4）时间复杂度

4、源码详解

1）条件判定

2）二分枚举模板

1）大于 $x$ 的最小数的下标

2）大于等于 $x$ 的最小数的下标

3）小于 $x$ 的最大数的下标

4）小于等于 $x$ 的最大数的下标