递归迭代和分治：分治与二分查找

Posted 2021-08-28 纵横千里，捭阖四方

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了递归迭代和分治：分治与二分查找相关的知识，希望对你有一定的参考价值。

1.分治的基本思想

在计算机科学中，分治法是一种很重要的算法。字面上的解释是“分而治之”，就是把一个复杂的问题分成两个或更多的相同或相似的子问题，再把子问题分成更小的子问题……直到最后子问题可以简单的直接求解，原问题的解即子问题的解的合并。这个技巧是很多高效算法的基础，如二分搜索、排序算法(快速排序，归并排序)，傅立叶变换(快速傅立叶变换)……

　　任何一个可以用计算机求解的问题所需的计算时间都与其规模有关。问题的规模越小，越容易直接求解，解题所需的计算时间也越少。例如，对于n个元素的排序问题，当n=1时，不需任何计算。n=2时，只要作一次比较即可排好序。n=3时只要作3次比较即可，…。而当n较大时，问题就不那么容易处理了。要想直接解决一个规模较大的问题，有时是相当困难的。

1.1、基本思想及策略

　　分治法的设计思想是：将一个难以直接解决的大问题，分割成一些规模较小的相同问题，以便各个击破，分而治之。

　　分治策略是：对于一个规模为n的问题，若该问题可以容易地解决（比如说规模n较小）则直接解决，否则将其分解为k个规模较小的子问题，这些子问题互相独立且与原问题形式相同，递归地解这些子问题，然后将各子问题的解合并得到原问题的解。这种算法设计策略叫做分治法。

　　如果原问题可分割成k个子问题，1<k≤n，且这些子问题都可解并可利用这些子问题的解求出原问题的解，那么这种分治法就是可行的。由分治法产生的子问题往往是原问题的较小模式，这就为使用递归技术提供了方便。在这种情况下，反复应用分治手段，可以使子问题与原问题类型一致而其规模却不断缩小，最终使子问题缩小到很容易直接求出其解。这自然导致递归过程的产生。分治与递归像一对孪生兄弟，经常同时应用在算法设计之中，并由此产生许多高效算法。

1.2、分治法使用场景

　　分治法所能解决的问题一般具有以下几个特征：

　　1) 该问题的规模缩小到一定的程度就可以容易地解决

　　2) 该问题可以分解为若干个规模较小的相同问题，即该问题具有最优子结构性质。

　　3) 利用该问题分解出的子问题的解可以合并为该问题的解；

　　4) 该问题所分解出的各个子问题是相互独立的，即子问题之间不包含公共的子子问题。

　　第一条特征是绝大多数问题都可以满足的，因为问题的计算复杂性一般是随着问题规模的增加而增加；

　　第二条特征是应用分治法的前提它也是大多数问题可以满足的，此特征反映了递归思想的应用；、

　　第三条特征是关键，能否利用分治法完全取决于问题是否具有第三条特征，如果具备了第一条和第二条特征，而不具备第三条特征，则可以考虑用贪心法或动态规划法。

　　第四条特征涉及到分治法的效率，如果各子问题是不独立的则分治法要做许多不必要的工作，重复地解公共的子问题，此时虽然可用分治法，但一般用动态规划法较好。

1.3、分治法的基本步骤

　　分治法在每一层递归上都有三个步骤：

　　step1 分解：将原问题分解为若干个规模较小，相互独立，与原问题形式相同的子问题；

　　step2 解决：若子问题规模较小而容易被解决则直接解，否则递归地解各个子问题

　　step3 合并：将各个子问题的解合并为原问题的解。

1.4、分治法的复杂性分析

　　一个分治法将规模为n的问题分成k个规模为n／m的子问题去解。设分解阀值n0=1，且adhoc解规模为1的问题耗费1个单位时间。再设将原问题分解为k个子问题以及用merge将k个子问题的解合并为原问题的解需用f(n)个单位时间。用T(n)表示该分治法解规模为|P|=n的问题所需的计算时间，则有：

　　T（n）= k T(n/m)+f(n)

　　通过迭代法求得方程的解：

　　递归方程及其解只给出n等于m的方幂时T(n)的值，但是如果认为T(n)足够平滑，那么由n等于m的方幂时T(n)的值可以估计T(n)的增长速度。通常假定T(n)是单调上升的，从而当mi≤n<mi+1时，T(mi)≤T(n)<T(mi+1)。

1.5. 可使用分治法求解的一些经典问题

　　（1）二分搜索

　　（2）大整数乘法

　　（3）Strassen矩阵乘法

　　（4）棋盘覆盖

　　（5）合并排序

　　（6）快速排序

　　（7）线性时间选择

　　（8）最接近点对问题

　　（9）循环赛日程表

　　（10）汉诺塔

上面的算法我们后面会逐步展开，这里先只看二分查找。

2.二分查找

因为每次折半的时候另外一半可以直接丢弃，不用考虑合并等问题，因此二分查找可以说是最简单，最典型的分治了。

二分查找，第一个感觉挺简单的，但是看看 Knuth 大佬（发明 KMP 算法的那位）怎么说的：

Although the basic idea of binary search is comparatively straightforward, the details can be surprisingly tricky…

这句话可以这样理解：思路很简单，细节是魔鬼。细节主要体现在条件的判断和+1还是-1上，与处理数组时的问题类似。

二分查找，不管是循环还是递归方式，我觉得应该达到写到闭着眼睛，一分钟就能写出来的地步。

2.1 循环的方式

public static int binarySearch(int[] array, int low, int high, int target) {        // 循环        while (low < high) {            int mid = (low + high) >> 1;            if (array[mid] == target) {                return mid ;             } else if (array[mid] > target) {                // 由于array[mid]不是目标值，因此再次递归搜索时，可以将其排除                high = mid -1;            } else {                // 由于array[mid]不是目标值，因此再次递归搜索时，可以将其排除                low = mid + 1;            }        }         return nums[left] == target ? left : -1;    }

这里在具体操作的时候可能有多种方式的，包括循环体中的 high = mid -1;和low = mid + 1也有多种方式的，这需要与if后面的条件配合，我觉得在理解的基础上熟记一种方式就行了。

2.2 递归的方式

递归方式更清晰一些：

public static int binarySearch1(int[] array, int low, int high, int target) {        //递归终止条件        if(low <= high){            int mid = low + (high-low) >> 1;            if(array[mid] == target){                return mid  ;  // 返回目标值的位置，从1开始            }else if(array[mid] > target){                // 由于array[mid]不是目标值，因此再次递归搜索时，可以将其排除                return binarySearch(array, low, mid-1, target);            }else{                // 由于array[mid]不是目标值，因此再次递归搜索时，可以将其排除                return binarySearch(array, mid+1, high, target);            }        }        return -1;   //表示没有搜索到    }

最后再强调一个细节：注意上面的mid计算可以改成 int mid = low + (high-low) >> 1;

使用 (high-low) 是为了防止数据太大时导致边界溢出的问题。

使用(high-low) >> 1是因为移位比除的效率更高。

这个也是面试时体现基本功的亮点。如果能写到这种程度，就是满分了，面试官基本不会再说什么了。

以上是关于递归迭代和分治：分治与二分查找的主要内容，如果未能解决你的问题，请参考以下文章