动态规划（DP）算法

Posted 2020-12-04 vanjing

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了动态规划（DP）算法相关的知识，希望对你有一定的参考价值。

参考https://blog.csdn.net/libosbo/article/details/80038549

动态规划是求解决策过程最优化的数学方法。利用各个阶段之间的关系，逐个求解，最终求得全局最优解，需要确认原问题与子问题、动态规划状态、边界状态、边界状态结值、状态转移方程。

以下每个例题，注意分析迭代关系是怎么找到的。

一、爬楼梯leetcode70:

You are climbing a stair case. It takes n steps to reach to the top.

Each time you can either climb 1 or 2 steps. In how many distinct ways can you climb to the top?

Note: Given n will be a positive integer.

Example 1:

Input: 2
Output: 2
Explanation: There are two ways to climb to the top.
1. 1 step + 1 step
2. 2 steps

Example 2:

Input: 3
Output: 3
Explanation: There are three ways to climb to the top.
1. 1 step + 1 step + 1 step
2. 1 step + 2 steps
3. 2 steps + 1 step

方法一：利用n个楼梯的步数，与n-1还有n-2之间的关系可以退出，f(n)==f(n-1)+f(n-2),相当于是直接考虑为n-1再上一步，和n-2直接上两步，不能考虑n-2有两种走法（一步一步，和一次两步，一步一步的会和n-1中的重复，导致算多了），最后不断的迭代直至可以n==1或者n==2，可以直接求出结果。

这个方法相当于是根据各个阶段之间的关系，列出迭代关系，并且写出临界解，从而结束递归的过程，否则将一直递归下去（所有的递归都是如此，如果没有边界条件提前结束递归，递归将不会停止）

这个时间复杂度是2^n相当于是一颗二叉树来着，leetcode显示time limit exceed

1 int climbStairs(int n) {
2         if(n==1||n==2){
3             return n;
4         }
5         return climbStairs(n-1)+climbStairs(n-2);    
6    }

方法二：利用迭代来实现尾递归

由于方法一是利用了尾递归来实现算法，考虑采用迭代来实现递归，并且递归本身算法复杂度是要远远大于其对应的迭代循环算法复杂度的，所以考虑利用迭代来减少时间复杂度。两种方法的差别在于递归是从上往下算，迭代是从下往上算。

 1 class Solution {
 2 public:
 3     int climbStairs(int n) {
 4         vector<int>iteration(n+1,0); //initializition
 5         iteration[1]=1;
 6         iteration[2]=2;
 7         int i=3;
 8         while(i<n+1){
 9             iteration[i]=iteration[i-1]+iteration[i-2];
10             i++;
11         }
12         return iteration[n];  
13     }
14 };

二、抢劫犯问题leetcode198

You are a professional robber planning to rob houses along a street. Each house has a certain amount of money stashed, the only constraint stopping you from robbing each of them is that adjacent houses have security system connected and it will automatically contact the police if two adjacent houses were broken into on the same night.

Given a list of non-negative integers representing the amount of money of each house, determine the maximum amount of money you can rob tonight without alerting the police.

题目分析：这个题目的分析关键在于DP算法中状态转移方程的求解，也就是求解是迭代关系，可以发现对于第i个房间而言，如果不抢劫第i个房间那么就是i-1个的抢劫数目，如果抢劫第i个房间那么就是一定不能抢劫i-1个房间，相当于是i-2个房间的抢劫数目，两者时间的最大值即可，从而成功得出迭代关系。

注意自身在分析问题时的错误：

一：在无法的出迭代关系的情况下，没有考虑根据题意对可能的情况进行分类，注意两个题目都是进行了分类的讨论，才得以顺利的得出迭代关系，并且盲目的理解为迭代关系一定是两者之间的和，没有考虑到最大值得情况。

二：在考虑迭代关系时一定要思考如何引入第i-1个和第i-2个问题的解，这道题就是通过分类讨论，成功剥离出了i-1和i-2的情况；迭代关系的另一个要素是如何把i与i-1和i-2之间的关系找到

三：在考虑迭代关系时一定把i考虑成足够大，因为在代码实现过程中i很小的情况是直接给出的，直接赋值的（对于有dp数组而言），i很小的情况下只是考虑为边界条件，作为循环的起始或者是迭代的结束。所以考虑迭代关系时一定不要具体化i而是直接假设i足够大去考虑。

求取迭代关系的步骤：

1、根据题意分类讨论，分类讨论一定要达到引入i-1和i-2的解

2、挖掘i和i-1还有i-2之间的关系

3、边界条件确认

方法一、使用迭代法

 1 class Solution {
 2 public:
 3     int rob(vector<int>& nums) {
 4         if(nums.empty()) return 0;
 5         if(nums.size()==1) return nums[0];
 6         vector<int>dp(nums.size(),0);
 7         dp[0]=nums[0];
 8         dp[1]=max(nums[0],nums[1]);
 9        for(int i=2;i<nums.size();i++){
10             dp[i]=max(dp[i-2]+nums[i],dp[i-1]);
11         }
12         return dp[nums.size()-1];
13     }
14 };

方法二、使用递归算法

class Solution {
public:
    int rob(vector<int>& nums) {
        int size=nums.size();
        if(size==0) return 0;
        if(size==1) return nums[0];
        if(size==2) return max(nums[0],nums[1]);
        vector<int>a1(nums.begin(),nums.end()-1);
        vector<int>a2(nums.begin(),nums.end()-2);
        return max(rob(a1),rob(a2)+nums[size-1]);
     
    }
};

可以发现这种方法再次出现了time limit exceed，时间复杂度是O(2^n),以后不用再考虑递归的DP算法了，直接使用迭代，时间复杂度降低很多。

以上两道例题都是相似的，接下来的例题稍有不同，要重点理解。

三、最大子段和leetcode53（重点理解）

Given an integer array nums, find the contiguous subarray (containing at least one number) which has the largest sum and return its sum.

注意自身在分析问题时的错误：

在分析问题的时候没有灵活变通，直接考虑前i个连续子数组数组的最大值，将无法进行分类讨论，无法得到递归关系，并且在考虑递归关系时也是直接考虑了i与i-1还有i-2之间的关系，其实可以考虑为i与i-1的关系即可，只要是一种可以迭代出所有情况的关系即可。在不能够得出迭代关系的时候需要变通的考虑，改变dp数组的意义，不需要一步到位，只要保证可以通过dp数组得到最后的结果即可。

code：dp数组表示的是以第i个元素结尾的连续子数组的最大值，最后再寻找dp的最大值

 1 class Solution {
 2 public:
 3     int maxSubArray(vector<int>& nums) {
 4         int size=nums.size();
 5         vector<int>dp(size,0);
 6         dp[0]=nums[0];
 7         for(int i=1;i<size;i++){
 8             if(dp[i-1]>0) dp[i]=dp[i-1]+nums[i];
 9             else dp[i]=nums[i];
10         }
11         int max1=dp[0];
12         for(int i=1;i<size;i++){
13             max1=max(max1,dp[i]);
14         }
15         return max1;
16     }
17 };

注意，这里判断dp[I-1]的正负来确定迭代关系（这是与之前两道例题都不同的地方），仔细理解根据num[i]正负来确定迭代关系的区别以及孰是孰非。

四、找零钱和leetcode322（非常经典的DP算法，稍复杂）——还未完全理解。。。

You are given coins of different denominations and a total amount of money amount. Write a function to compute the fewest number of coins that you need to make up that amount. If that amount of money cannot be made up by any combination of the coins, return -1.

Example 1:
coins = [1, 2, 5], amount = 11
return 3 (11 = 5 + 5 + 1)

Example 2:
coins = [2], amount = 3
return -1.

Note:
You may assume that you have an infinite number of each kind of coin.

 1 class Solution {
 2 public:
 3     int coinChange(vector<int>& coins, int amount) {
 4         vector<int>dp(amount+1,amount+1);
 5         dp[0]=0;
 6         for(int i=1;i<=amount;i++){
 7             for(int m:coins){
 8                 if(m<=i) dp[i]=min(dp[i],dp[i-m]+1);
 9             }            
10         }
11         if(dp.back()==amount+1) return -1;
12             else return dp.back();
13     }
14 };

五、三角形——还未完全理解。。。

Given a triangle, find the minimum path sum from top to bottom. Each step you may move to adjacent numbers on the row below.

For example, given the following triangle

[
     [2],
    [3,4],
   [6,5,7],
  [4,1,8,3]
]

The minimum path sum from top to bottom is 11 (i.e., 2 + 3 + 5 + 1 = 11).

这道题目类似于第三题，都是对dp数组的意义进行转换，从而以退为进解决问题。

 1 class Solution {
 2 public:
 3     int minimumTotal(vector<vector<int>>& triangle) {
 4         int size=triangle.size();
 5         vector<vector<int>>dp(size,vector<int>(size,INT_MAX));
 6         dp[0][0]=triangle[0][0];
 7         for(int i=1;i<size;i++){
 8             for(int j=0;j<triangle[i].size();j++){
 9                 if(j==0) dp[i][j]=dp[i-1][j]+triangle[i][j];
10                 if(j==triangle[i].size()-1) dp[i][j]=dp[i-1][j-1]+triangle[i][j];
11                 if(j!=0&&j!=triangle[i].size()-1) dp[i][j]=min(dp[i-1][j-1]+triangle[i][j],dp[i-1][j]+triangle[i][j]);              
12             }
13         }
14         return *min_element(dp[size-1].begin(),dp[size-1].end());
15     }
16 };

以上是关于动态规划（DP）算法的主要内容，如果未能解决你的问题，请参考以下文章