谈谈动态规划的本质

Posted 2021-09-14 小齐本齐

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了谈谈动态规划的本质相关的知识，希望对你有一定的参考价值。

前言

在上一篇文章动态规划的文章中，我们先由 Fibonacci 例子引入到了动态规划中，然后借助兑换零钱的例子，分析了动态规划最主要的三个性质，即：

重叠子问题
最优子结构
状态转移方程

但是动态规划远不止这么简单。

今天这篇文章，让我们深入动态规划，一窥动态规划的本质。

我们既然要彻底搞清楚动态规划，那么一个不可避免的问题就是：

递归，贪心，记忆化搜索和动态规划之间到底有什么不同？

动态规划于递归：只是单纯的空间换时间吗？并不是，斐波那切数列的例子很好的推翻了这个观点。
动态规划于贪心：只是贪心的加强版吗？并不是，零钱兑换的例子同样推翻了这个观点。

那么，动态规划的核心到底是什么？

要回答这个问题，我们不妨先回答下面这个问题：

到底哪些问题适合用动态规划即？怎么鉴定 DP 可解问题？

相信当我们认识到哪些问题可以用 DP 解决，我们也就自然找到了 DP 和其它算法思想的区别，也就是动态规划的核心。

动态规划核心

首先我们要搞清楚，动态规划只适用于某一类问题，只是某一类问题的解决方法。

那么这“某一类问题”是什么问题呢？

聊这个之前我们有必要稍微了解下计算机的本质。

基于冯诺依曼体系结构的计算机本质上是一个状态机，为什么这么说呢？因为 CPU 要进行计算就必须和内存打交道。

因为数据存储在内存当中（寄存器和外盘性质也一样），没有数据 CPU 计算个空气啊？所以内存就是用来保存状态（数据）的，内存中当前存储的所有数据构成了当前的状态，CPU 只能利用当前的状态计算下一个状态。

我们用计算机处理问题，无非就是在思考：如何用变量来储存状态，以及如何在状态之间转移：由一些变量计算出另一些变量，由当前状态计算出下一状态。

基于这些，我们也就得到了评判算法的优劣最主要的两个指标：

空间复杂度：就是为了支持计算所必需存储的状态
时间复杂度：就是初始状态到最终状态所需多少步

如果上述表述还不是很清楚，那我们还是举之前 Fibonacci 的例子来说：

要计算当前 f(n)，只需要知道 f(n - 1) 和 f(n - 2).

即：

要计算当前状态 f(n)，只需要计算状态 f(n - 1)和 f(n -2).

也就是说当前状态只与前两个状态有关，所以对于空间复杂度：我们只需保存前两个状态即可。

这也就很好的解释了为什么动态规划并不是单纯的空间换时间，因为它其实只跟状态有关。

由一个状态转移到另一状态所需的计算时间也是常数，故线性增加的状态，其总的时间复杂度也是线性的。

以上便是动态规划的核心，即：

状态的定义及状态之间的转移（状态方程的定义）。

那么如何定义所谓的“状态”和“状态之间的转移”呢？

我们引入维基百科的定义：

dynamic programming is a method for solving a complex problem by breaking it down into a collection of simpler subproblems.

那就是通过拆分问题，定义问题状态和状态之间的关系，使得问题能够以递推（或者说分治）的方式去解决。

纸上谈来终觉浅，下边我们再来看一道同样非常经典的例题。

最长递增子序列

这是 LeetCode 第 300 题。

给定一个数列，长度为 N，求这个数列的最长上升（递增）子数列（LIS）的长度.
示例 1：
输入：nums = [10,9,2,5,3,7,101,18]
输出：4
解释：最长递增子序列是 [2,3,7,101]，因此长度为4
示例 2：
输入：nums = [0,1,0,3,2,3]
输出：4
解释：最长递增序列是 [0,1,2,3]，因此长度为4

我们如何进行状态的定义及状态间转移的定义呢？

一、状态的定义

首先我们应该进行问题的拆分，即进行这个问题子问题的定义。

所以，我们重新定义一下这个问题：

给定一个数列，长度为 N，
设 F~k~为：给定数列中第 k 项结尾的最长递增子序列的长度
求 F~1~到 F~N~的最大值

是不是上边这个定义与原问题一样？

显然二者等价，不过明显第二种定义的方式，我们找到了子问题。

对于 F~k~来讲，F~1~到 F~k-1~都是 F~k~的子问题。

上述新问题的 F~k~ 就叫做状态。

F~k~为数列中第 k 项结尾的 LIS 的长度即为状态的定义。

二、状态转移方程的定义

状态定义好之后，状态与状态之间的关系式，就叫状态转移方程。

此题以 F~k~的定义来说：

设 F~k~为：给定数列中第 k 项结尾的最长递增子序列的长

思考，状态之间应该怎么转移呢？

还记得我们之前说的拆分问题不，在这里同样我们可以沿用这一招，即拆分数据。

如果数列只有一个数呢？那我们应该返回 1(我们找到了状态边界情况)。

那么我们可以写出以下状态转移方程：

F~1~ = 1
F~k~ = max ( F~i~ + 1 | i ∈（1，k-1）)（k > 1）

即：以第 k 项结尾的 LIS 的长度是：max { 以第 i 项结尾的 LIS 长度 + 1 }, 第 i 项比第 k 项小

大家理解下，是不是这么回事～

回忆一下我们是怎么做的？

我们通过拆分问题进行了问题（子问题）的重定义（状态的定义）；
通过状态的定义，再结合状态的边界情况，我们写出了状态与状态之间转移即状态转移方程的定义。

写出了状态转移方程，可以说到此，动态规划算法核心的思想我们已经表达出来了。

剩下的只不过是用记忆化地求解递推式的方法来解决就行了。

下面我们尝试写出代码。

代码

首先我们定义 dp 数组：

int[] dp = new int[nums.length];

（注意这里 dp 数组的大小跟上一篇文章兑换零钱的例子有一丢丢不同，即这里没有+1，大家可以再点击这里看下上一篇文章仔细理解一下。）

那么这里 dp 数组的含义就是：

dp[i] 保存的值即是给定数组 i 位之前最长递增子序列的长度。

那么我们的初始状态是什么呢？

我们知道状态的边界情况为：

F~1~ = 1

即如果数据只有一位那么应该返回 1；
当数据个数 > 1 时，如果整个数列没有出现第二个递增的数，那么同样返回 1.

所以，初始状态我们给 dp 数组每个位置都赋为 1.

Arrays.fill(dp, 1);

然后，我们从给定数组的第一个元素开始遍历，即写出外层的 for 循环：

for(int i = 0; i < nums.length;i++){
        ......
}

当我们外层遍历到某元素时，我们怎么做呢？

我们得找一下，在这个外层元素之前，存不存在比它小的数，如果存在，那么我们就更新此外层元素的 dp[i]

如果某元素之前有比它小的数，那么这不就构成了递增子序列了吗？

因此我们可以写出内层 for 循环：

for (int j = 0; j < i; j++) {
    //如果前面有小于当前外层nums[i]的数，那么就令当前dp[i] = dp[j] + 1
     if (nums[j] < nums[i]) {
         //因为当前外层nums[i]前边可能有多个小于它的数，即存在多种组合，我们取最大的一组放到dp[i]里
          dp[i] = Math.max(dp[i], dp[j] + 1);
      }
}

两层循环结束时，dp[] 数组里存储的就是相应元素位置之前的最大递增子序列长度，我们只需遍历 dp[] 数组寻找出最大值，即可求得整个数组的最大递增子序列长度：

 int res = 0;
 for(int k = 0; k < dp.length; k++){
      res = Math.max(res, dp[k]);
 }

此题代码也就写完了，下面贴出完整代码:

class Solution {
  public int lengthOfLIS(int[] nums) {
      if(nums.length < 2) return 1;
      int[] dp = new int[nums.length];
      Arrays.fill(dp,1);
      for(int i = 0;i < nums.length;i++){
        for(int j = 0;j < i;j++){
          if(nums[j] < nums[i]){
            dp[i] = Math.max(dp[i],dp[j] + 1);
          }
        }
      }
      int res = 0;
      for(int k = 0;k < dp.length;k++){
        res = Math.max(res,dp[k]);
      }
      return res;
  }
}

这个题两层 for 循环跟之前兑换零钱的代码基本上差不多，大家可以结合上一篇文章再一起对比理解。

不同之处只是内层 for 循环的判断条件和状态转移方程的表达（如何更新 dp[]），这也是动态规划的本质所在。

小结

关于动态规划有很多误区和误解，比如最常见的可能就是说它是空间换时间，以及搞不清楚它和贪心的区别。

希望这两篇动态规划的文章能帮你消除这些误区，并且更好的理解到动态规划的本质，理解状态和状态方程。

当然，仅仅这两篇文章想说透动态规划是远远不够的，所以接下来会具体的讲解一些典型问题，比如背包问题、石子游戏、股票问题等等，希望能帮你在学习算法的道路上少走一些弯路。

如果大家有什么想了解的算法和题目类型，非常欢迎在评论区留言告诉我，我们下期见！

以上是关于谈谈动态规划的本质的主要内容，如果未能解决你的问题，请参考以下文章