动态规划总结

Posted xiehang

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了动态规划总结相关的知识,希望对你有一定的参考价值。

背包问题一直是动态规划的热点,也是各大公司笔试的常客,所以掌握基本的背包解题思路是很重要的

0-1 背包问题

题目

N件物品和一个容量为 V 的背包。第i件物品的费用是 c[i],价值是 w[i]。求解将哪些物品装入背包可使价值总和最大。

解题思路:

这是最基础的背包问题,特点是:每种物品仅有一件,可以选择放或不放。

用子问题定义状态:即 f[i][v] 表示考虑将 i 件物品恰放入一个容量为 v 的背包可以获得的最大价值。则其状态转移方程便是:

f[i][v] = max(f[i - 1][v], 
              f[i - 1][v - c[i]] + w[i])

这个方程非常重要,基本上所有跟背包相关的问题的方程都是由它衍生出来的。

“将前 i 件物品放入容量为 v 的背包中”这个子问题,若只考虑第 i 件物品的策略(放或不放),那么就可以转化为一个只牵扯前 i-1 件物品的问题。

  • f[i - 1][v]

如果不放第 i 件物品,那么问题就转化为“前 i-1 件物品放入容量为 v 的背包中”,价值为 f[i-1][v]

  • f[i - 1][v - c[i]] + w[i]

如果放第 i 件物品,那么问题就转化为“前 i-1 件物品放入剩下的容量为 v-c[i] 的背包中”,此时能获得的最大价值就是 f[i-1][v-c[i]] 再加上通过放入第i件物品获得的价值 w[i]

代码实现

public class Solution 
    public static void main(String[] args) 
        int[] w = 6, 29, 39;
        int[] v = 6, 10, 12;
        int W = 6;
        //6
        System.out.println(new Solution().knapsack01(w, v, W));
    

    public int knapsack01(int[] w, int[] v, int W) 
        int len = w.length;
        //dp[i][j]表示前i件物品恰放入一个容量为j的背包可以获得的最大价值
        //状态转移方程为:f[i][j]=maxf[i-1][j],f[i-1][j-v[i]]+w[i]
        int[][] dp = new int[len + 1][W + 1];
        //初始化:重量为0或者背包容量为0时最大价值为0,数组本来就是初始化值为0,跳过

        for (int i = 1; i <= len; i++) 
            for (int j = 1; j <= W; j++) 
                //f[i][j]=maxf[i-1][j],f[i-1][j-v[i]]+w[i]
                //当前最大价值等于放上一件的最大价值
                dp[i][j] = dp[i - 1][j];
                //如果当前物品(i-1)能放入背包
                if (j >= w[i - 1]) 
                    //就考虑放入还是不放入↓
                    //这里需要注意,i - 1表示的是当前件,因为这里的i从1开始
                    dp[i][j] = Math.max(dp[i - 1][j], v[i - 1] + dp[i - 1][j - w[i - 1]]);
                
            
        

        return dp[len][W];
    

优化空间复杂度

以上方法的时间和空间复杂度均为 O(VN),其中时间复杂度应该已经不能再优化了,但空间复杂度却可以优化到O。(如果需要)

先考虑上面讲的基本思路如何实现,肯定是有一个主循环 i=1..N,每次算出来二维数组 f[i][0..V] 的所有值。那么,如果只用一个数组 f[0..V],能不能保证第i次循环结束后f[v]中表示的就是我们定义的状态 f[i][v] 呢?f[i][v] 是由 f[i-1][v]f[i-1][v-c[i]] 两个子问题递推而来,能否保证在推 f[i][v] 时(也即在第 i 次主循环中推 f[v] 时)能够得到 f[i-1][v]f[i-1][v-c[i]] 的值呢?事实上,这要求在每次主循环中我们以 v=V..0 的顺序推 f[v] ,这样才能保证推 f[v]f[v-c[i]] 保存的是状态 f[i-1][v-c[i]] 的值。伪代码如下:

for i = 1..N
    for v = V..0
        f[v]=maxf[v],f[v-c[i]]+w[i];

其中的f[v]=maxf[v],f[v-c[i]]一句恰就相当于我们的转移方程f[i][v]=maxf[i-1][v],f[i-1][v-c[i]],因为现在的f[v-c[i]]就相当于原来的f[i-1][v-c[i]]。如果将v的循环顺序从上面的逆序改成顺序的话,那么则成了f[i][v]由f[i][v-c[i]]推知,与本题意不符,但它却是另一个重要的背包问题P02最简捷的解决方案,故学习只用一维数组解01背包问题是十分必要的。

事实上,使用一维数组解01背包的程序在后面会被多次用到,所以这里抽象出一个处理一件01背包中的物品过程,以后的代码中直接调用不加说明。

过程ZeroOnePack,表示处理一件01背包中的物品,两个参数cost、weight分别表明这件物品的费用和价值。

以上是关于动态规划总结的主要内容,如果未能解决你的问题,请参考以下文章

动态规划总结

总结动态规划十问十答

令狐冲老师的动态规划总结

Leetcode 动态规划刷题总结

算法---动态规划(编辑距离不同子序列动态规划总结)

强化学习总结 03-动态规划