《详解二分查找》视频解说
Posted 英雄哪里出来
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了《详解二分查找》视频解说相关的知识,希望对你有一定的参考价值。
该视频首发公众号和B站,目前试看版本为B站版本。主要讲解二分查找的通用模板。文章末尾有相应的源码。
Click Me 获取 粉丝专属 《算法和数据结构》源码,以及获取博主的联系方式。
前言
二分查找,又叫二分枚举是在一个单调有序的数组中查找某个元素的搜索算法。原理比较简单,基本说一遍就知道是怎么一回事。然而,实际过程中,很容易写错,比如:
1)左区间是加一还是不加?
2)右区间是减一还是不减?
3)迭代的终止条件怎么写?
4)为什么有时候会死循环?
带着以上几个疑问,这篇文章将对二分查找的所有写法进行一个归纳总结。
一、线性枚举
1、线性枚举定义
线性枚举指的就是遍历某个一维数组(顺序表)的所有元素,找到满足条件的那个元素并且返回,返回值可以是下标,也可以是元素本身。
由于是遍历的,穷举了所有情况,所以一定是可以找到解的,一些资料上也称之为 暴力算法 (Brute Force)。接下来,我们通过一个例子来理解 线性枚举。
2、举例说明
【例题1】给定一个单调不降的有序数组 a r r arr arr 和 一个值 x x x,要求找到大于 x x x 的最小数的下标。
3、算法分析
我们从这个问题中提取几个关键字并分类如下:
1)前提:单调不降、有序;
2)条件:大于
x
x
x、最小数;
3)返回结果:下标;
1)前提
前提就是问题给定时的初始数组需要满足的先天性条件,保证数据是能够符合这个前提的。这里的前提是 数组一定是有序的,且是单调不降的,即 数组下标大的数 不会比 数组下标小的数 更小。
2)条件
这个问题中的条件有两个:
1)大于
x
x
x ;
2)值最小;
我们如果仔细分析一下这个问题,就可以发现,正因为这里的数组是单调不降的,所以,一旦满足 某个数大于
x
x
x,之后的所有数必然都满足 大于
x
x
x 这个条件。所以我们必然可以把数组分成两部分,一部分是 大于
x
x
x 的,另一部分是 不大于
x
x
x 的。
3)返回结果
这里的返回结果要求是下标,而我们遍历操作也是通过遍历数组的下标进行的,所以找到满足条件的,返回下标即可。
4、画解枚举
接下来,我们通过一组实际的数据来解释这个问题。
a
r
r
=
[
1
,
3
,
4
,
6
,
6
,
6
,
7
,
8
,
9
]
arr = [1, 3, 4, 6, 6, 6, 7, 8, 9]
arr=[1,3,4,6,6,6,7,8,9]
1)划分
对于这个数组,当
x
=
6
x = 6
x=6 时,我们将数组分成两部分,大于 6 的部分用 绿色表示,不大于 6 的部分用红色表示。
这么表示的目的,主要是为了方便记忆,联想一下 红绿灯,绿色代表可以通行,即 “大于6” 这个条件满足;红色代表禁止通行,即条件不满足。
2)游标
设定一个游标,初始时指向数组的第 0 个元素(C语言中数组下标从 0 开始计数)。
游标,顾名思义,就是游动的下标。你也可以叫指针,我之所以没有称之为指针,是不想它和C语言中的指针概念混淆。
3)遍历
遍历就是判断当前游标指向的元素是否是绿色的,如果是绿色的直接返回,因为它一定是大于 x x x 且值最小的;如果不是,则增加游标的值,继续下一次判断,直到数组遍历完毕。如下图所示:
数字 7 就是我们要找到 大于 6 的最小数,它的下标为 6。
4)详解
int isGreen(int val, int x) { // (1)
return val > x;
}
int findFirstBiggerThan(int *arr, int arrSize, int x) {
int i;
for(i = 0; i < arrSize; ++i) { // (2)
if( isGreen(arr[i], x) ) { // (3)
return i;
}
}
return arrSize; // (4)
}
-
(
1
)
(1)
(1)
int isGreen(int val, int x)
这个函数代表条件是否满足,满足返回 1,否则返回 0;这里的条件便是 v a l > x val > x val>x。 - ( 2 ) (2) (2) 下标从小到大,从 0 开始遍历数组 a r r arr arr;
- ( 3 ) (3) (3) 一旦遇到大于 x x x 的数,则返回它的下标,因为是下标从小往大遍历的,所以第一个找到满足条件的数一定是值最小的;
- ( 4 ) (4) (4) 如果找不到,说明所有的数都是小于等于 x x x 的,直接返回数组长度;
5、举一反三
接下来,我们来看看线性枚举的其它几种问法。
【例题2】给定一个单调不降的有序数组如下: [ 1 , 3 , 4 , 6 , 6 , 6 , 7 , 8 , 9 ] [1, 3, 4, 6, 6, 6, 7, 8, 9] [1,3,4,6,6,6,7,8,9]。要求找到以下元素:
( 1 ) (1) (1) > 6 \\gt 6 >6 的 最小数 的下标位置;
( 2 ) (2) (2) ≥ 6 \\ge 6 ≥6 的 最小数 的下标位置;
( 3 ) (3) (3) < 6 \\lt 6 <6 的 最大数 的下标位置;
( 4 ) (4) (4) ≤ 6 \\le 6 ≤6 的 最大数 的下标位置;
对于这四个问题,我们可以发现它们的答案如下所示:
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
---|---|---|---|---|---|---|---|---|
1 | 3 | 4 | 6 | 6 | 6 | 7 | 8 | 9 |
( 3 ) (3) (3) | ( 2 ) (2) (2) | ( 4 ) (4) (4) | ( 1 ) (1) (1) |
1)大于 x x x 的最小数的下标
将数组按照条件进行划分,然后利用上文提到的findFirstBiggerThan
函数求解即可。
2)大于等于 x x x 的最小数的下标
我们把问题做个变形,将问题变成找 大于等于 x x x 的最小数的下标(比之前的问题多了一个等于)。按照条件划分的结果应该是包含 6 本身的,所以如下图所示:
遍历数组的部分不变,只不过条件变成了 大于等于。C语言实现如下:
int isGreen(int val, int x) {
return val >= x; // (1)
}
int findFirstBiggerEqualThan(int *arr, int arrSize, int x) {
int i;
for(i = 0; i < arrSize; ++i) {
if( isGreen(arr[i], x) ) {
return i;
}
}
return arrSize;
}
-
(
1
)
(1)
(1) 将原先的
>
号改成>=
即可;
3)小于 x x x 的最大数的下标
上面两个问题能理解的话,我们再来看一个问题,如何找到 小于 x x x 的最大数的下标 ,要求下标最大,那么我们在枚举的过程中,如果发现一个大于等于 x x x 的数,那么后续都不用枚举了,并且需要返回这个数的前一个位置。条件划分如下图所示:
我们要做的是返回红色中的最大下标,C语言实现如下:
int isGreen(int val, int x) {
return val >= x; // (1)
}
int findLastSmallThan(int *arr, int arrSize, int x) {
int i;
for(i = 0; i < arrSize; ++i) {
if( isGreen(arr[i], x) ) {
return i - 1;
}
}
return arrSize - 1;
}
-
(
1
)
(1)
(1) 大于等于
x
x
x 时,
isGreen
成立; - ( 2 ) (2) (2) 由于我们要做的是返回红色中的最大下标,所以一旦遇到大于等于 x x x 的数(即绿色的情况),则返回它的前一个下标;
-
(
3
)
(3)
(3) 如果找不到,则返回
arrSize - 1
,即所有数都是红色的,则最大下标就是数组的最后一个元素的下标;
4)小于等于 x x x 的最大数的下标
我们把问题继续做变形,将问题变成找 小于等于 x x x 的最大数的下标(比之前的问题多了一个等于)。划分如下图所示:
遍历数组的部分不变,只不过条件变成了 大于,我们要做的是返回红色中的最大下标,C语言实现如下:
int isGreen(int val, int x) {
return val > x; // (1)
}
int findLastSmallEqualThan(int *arr, int arrSize, int x) {
int i;
for(i = 0; i < arrSize; ++i) {
if( isGreen(arr[i], x) ) {
return i - 1;
}
}
return arrSize - 1;
}
-
(
1
)
(1)
(1) 将原先的
>=
号改成>
即可;
6、时间复杂度
以上的内容就是线性枚举的几种常见情况,也就是无脑遍历所有情况,并且在满足条件的第一时间退出循环,当数组长度为
n
n
n 时,算法的时间复杂度为
O
(
n
)
O(n)
O(n),比较低效,有没有更加高效的算法呢?
接下来出场的,就是本文的主角 —— 二分枚举。
二、二分枚举
1、二分枚举定义
二分枚举,也叫二分查找,指的就是给定一个区间,每次选择区间的中点,并且判断区间中点是否满足某个条件,从而选择左区间继续求解还是右区间继续求解,直到区间长度不能再切分为止。
由于每次都是把区间折半,又叫折半查找,时间复杂度为
O
(
l
o
g
2
n
)
O(log_2n)
O(log2n),和线性枚举的求解结果一直,但是高效许多,返回值可以是下标,也可以是元素本身。
2、举例说明
【例题3】只有两种颜色的数组 a r r arr arr ,左边部分为红色用 0 表示,右边部分为绿色用 1 表示,要求找到下标最小的绿色元素的下标。
如图所示,下标最小的绿色元素的下标为 3,所以应该返回 3。
3、算法分析
1)目标
对于这个问题,当我们拿到这个数组的时候,第一个绿色位置在哪里,我们是不知道的,所以,现在的目标就是要通过二分枚举找到红色区域和绿色区域的边界。
2)游标
利用线性枚举的思路,我们引入游标的概念,只不过需要两个游标,左边一个红色游标,右边一个绿色游标。并且游标初始位置都在数组以外,对于一个 n n n 个元素的数组,红色游标初始位置在 − 1 -1 −1,绿色游标初始位置在 n n n。
3)二分
我们将两个游标相加,并且除 2,从而得到游标的中点,并且判断中点所在位置的颜色,发现是绿色的,这说明从 中点游标 到 绿色游标 的元素都是绿色的。如下图所示:
于是,我们可以把 绿色游标 替换成 中点游标,如下图所示:
这样就完成了一次二分,区间相比之前,缩小了一半。注意,我们要求的解,一定永远在 红色游标 和 绿色游标 之间。
然后,我们继续将两个游标相加,并且除 2,从而得到游标的中点,并且判断中点所在位置的颜色,发现是红色的,这说明从 红色游标 到 中点游标 的元素都是红色的。如下图所示:
于是,我们可以把 红色游标 替换成 中点游标,如下图所示:
同样上述算法,再经过两次二分以后,我们得到了如下结果:
这个时候,这个时候 红色游标 和 绿色游标 的位置一定相差 1,并且 绿色游标 的位置就是我们这个问题要求的解。
4)时间复杂度
由于每次操作都是将区间减小一半,所以时间复杂度为 O ( l o g 2 n ) O(log_2n) O(log2n)。
4、源码详解
那么接下来,我们来看下,如何用 C语言来 实现这个问题。
1)条件判定
判断一个元素是绿色还是红色,我们可以单独用一个函数来实现,根据题意,当值为 1 时代表绿色,值为 0 时代表红色,C语言实现如下:
int isGreen(int val) {
return val == 1;
}
2)二分枚举模板
接下来的二分枚举模板可以解决大部分二分枚举的问题,请妥善保管。
int binarySearch(int *arr, int arrSize, int x) {
int l = -1, r = arrSize; // (1)
int mid;
while(r - l > 1) { // (2)
mid = l + (r - l) / 2; // (3)
if( isGreen(arr[mid], x) ) // (4)
r = mid; // (5)
else
l = mid; // (6)
}
以上是关于《详解二分查找》视频解说的主要内容,如果未能解决你的问题,请参考以下文章