递归迭代和分治:分治与二分查找

Posted 纵横千里,捭阖四方

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了递归迭代和分治:分治与二分查找相关的知识,希望对你有一定的参考价值。

1.分治的基本思想

在计算机科学中,分治法是一种很重要的算法。字面上的解释是“分而治之”,就是把一个复杂的问题分成两个或更多的相同或相似的子问题,再把子问题分成更小的子问题……直到最后子问题可以简单的直接求解,原问题的解即子问题的解的合并。这个技巧是很多高效算法的基础,如二分搜索、排序算法(快速排序,归并排序),傅立叶变换(快速傅立叶变换)……

  任何一个可以用计算机求解的问题所需的计算时间都与其规模有关。问题的规模越小,越容易直接求解,解题所需的计算时间也越少。例如,对于n个元素的排序问题,当n=1时,不需任何计算。n=2时,只要作一次比较即可排好序。n=3时只要作3次比较即可,…。而当n较大时,问题就不那么容易处理了。要想直接解决一个规模较大的问题,有时是相当困难的。

1.1、基本思想及策略

  分治法的设计思想是:将一个难以直接解决的大问题,分割成一些规模较小的相同问题,以便各个击破,分而治之。

  分治策略是:对于一个规模为n的问题,若该问题可以容易地解决(比如说规模n较小)则直接解决,否则将其分解为k个规模较小的子问题,这些子问题互相独立且与原问题形式相同,递归地解这些子问题,然后将各子问题的解合并得到原问题的解。这种算法设计策略叫做分治法。

  如果原问题可分割成k个子问题,1<k≤n,且这些子问题都可解并可利用这些子问题的解求出原问题的解,那么这种分治法就是可行的。由分治法产生的子问题往往是原问题的较小模式,这就为使用递归技术提供了方便。在这种情况下,反复应用分治手段,可以使子问题与原问题类型一致而其规模却不断缩小,最终使子问题缩小到很容易直接求出其解。这自然导致递归过程的产生。分治与递归像一对孪生兄弟,经常同时应用在算法设计之中,并由此产生许多高效算法。

1.2、分治法使用场景

  分治法所能解决的问题一般具有以下几个特征:

  1) 该问题的规模缩小到一定的程度就可以容易地解决

  2) 该问题可以分解为若干个规模较小的相同问题,即该问题具有最优子结构性质。

  3) 利用该问题分解出的子问题的解可以合并为该问题的解;

  4) 该问题所分解出的各个子问题是相互独立的,即子问题之间不包含公共的子子问题。

  第一条特征是绝大多数问题都可以满足的,因为问题的计算复杂性一般是随着问题规模的增加而增加;

  第二条特征是应用分治法的前提它也是大多数问题可以满足的,此特征反映了递归思想的应用;、

  第三条特征是关键,能否利用分治法完全取决于问题是否具有第三条特征,如果具备了第一条和第二条特征,而不具备第三条特征,则可以考虑用贪心法或动态规划法。

  第四条特征涉及到分治法的效率,如果各子问题是不独立的则分治法要做许多不必要的工作,重复地解公共的子问题,此时虽然可用分治法,但一般用动态规划法较好。

1.3、分治法的基本步骤

  分治法在每一层递归上都有三个步骤:

  step1 分解:将原问题分解为若干个规模较小,相互独立,与原问题形式相同的子问题;

  step2 解决:若子问题规模较小而容易被解决则直接解,否则递归地解各个子问题

  step3 合并:将各个子问题的解合并为原问题的解。

1.4、分治法的复杂性分析

  一个分治法将规模为n的问题分成k个规模为n/m的子问题去解。设分解阀值n0=1,且adhoc解规模为1的问题耗费1个单位时间。再设将原问题分解为k个子问题以及用merge将k个子问题的解合并为原问题的解需用f(n)个单位时间。用T(n)表示该分治法解规模为|P|=n的问题所需的计算时间,则有:

  T(n)= k T(n/m)+f(n)

  通过迭代法求得方程的解:

  递归方程及其解只给出n等于m的方幂时T(n)的值,但是如果认为T(n)足够平滑,那么由n等于m的方幂时T(n)的值可以估计T(n)的增长速度。通常假定T(n)是单调上升的,从而当mi≤n<mi+1时,T(mi)≤T(n)<T(mi+1)。

1.5. 可使用分治法求解的一些经典问题

  (1)二分搜索

  (2)大整数乘法

  (3)Strassen矩阵乘法

  (4)棋盘覆盖

  (5)合并排序

  (6)快速排序

  (7)线性时间选择

  (8)最接近点对问题

  (9)循环赛日程表

  (10)汉诺塔

 上面的算法我们后面会逐步展开,这里先只看二分查找。

2.二分查找

因为每次折半的时候另外一半可以直接丢弃,不用考虑合并等问题,因此二分查找可以说是最简单,最典型的分治了。

二分查找,第一个感觉挺简单的,但是看看 Knuth 大佬(发明 KMP 算法的那位)怎么说的:

Although the basic idea of binary search is comparatively straightforward, the details can be surprisingly tricky…

这句话可以这样理解:思路很简单,细节是魔鬼。细节主要体现在条件的判断和+1还是-1上,与处理数组时的问题类似。

二分查找,不管是循环还是递归方式,我觉得应该达到写到闭着眼睛,一分钟就能写出来的地步。

2.1 循环的方式

public static int binarySearch(int[] array, int low, int high, int target) {        // 循环        while (low < high) {            int mid = (low + high) >> 1;            if (array[mid] == target) {                return mid ;             } else if (array[mid] > target) {                // 由于array[mid]不是目标值,因此再次递归搜索时,可以将其排除                high = mid -1;            } else {                // 由于array[mid]不是目标值,因此再次递归搜索时,可以将其排除                low = mid + 1;            }        }         return nums[left] == target ? left : -1;    }

这里在具体操作的时候可能有多种方式的,包括循环体中的 high = mid -1;和low = mid + 1也有多种方式的,这需要与if后面的条件配合,我觉得在理解的基础上熟记一种方式就行了。

2.2 递归的方式

递归方式更清晰一些:

public static int binarySearch1(int[] array, int low, int high, int target) {        //递归终止条件        if(low <= high){            int mid = low + (high-low) >> 1;            if(array[mid] == target){                return mid  ;  // 返回目标值的位置,从1开始            }else if(array[mid] > target){                // 由于array[mid]不是目标值,因此再次递归搜索时,可以将其排除                return binarySearch(array, low, mid-1, target);            }else{                // 由于array[mid]不是目标值,因此再次递归搜索时,可以将其排除                return binarySearch(array, mid+1, high, target);            }        }        return -1;   //表示没有搜索到    }

最后再强调一个细节:注意上面的mid计算可以改成 int mid = low + (high-low) >> 1;

使用 (high-low) 是为了防止数据太大时导致边界溢出的问题。

使用(high-low) >> 1是因为移位比除的效率更高。

这个也是面试时体现基本功的亮点。如果能写到这种程度,就是满分了,面试官基本不会再说什么了。

以上是关于递归迭代和分治:分治与二分查找的主要内容,如果未能解决你的问题,请参考以下文章

五大经典算法思想之分治策略

算法导论第2章 分治法与归并排序, 二分查找法

二分查找Binary-Search——//递归与分治策略//

递归与分治思想:治思想 && 折半查找法(迭代 && 递归)

C/C++ 分治算法(二分查找算法递归实现)

C/C++ 分治算法(二分查找算法递归实现)