控制与人生: 上篇-规划篇 动态规划
Posted 我思故我在
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了控制与人生: 上篇-规划篇 动态规划相关的知识,希望对你有一定的参考价值。
序里未提及为什么标题叫“控制与人生”,这个和我做的研究有关,我本科和博士专业就是自动控制与动态系统。很多控制领域的想法,从哲学的角度来看,适用于各行各业,也包括我们人生的规划和平日的学习。本篇先谈谈利用控制的一些基本核心思想如何进行规划。今天我们聊聊动态规划(dynamic programming)。
动态规划是最优控制里面的一个核心思想,其本质是逆序求最优解。我们先来看一个简单的例子。
例一: 三个海盗截获了100颗一模一样的钻石,分配规则如下:
(1) 随机抽签得到一个先后顺序,假定为 A,B,以及 C。
(2) 小A 先提出一个分配方案 ,比如铁公鸡型“我100颗,你们俩鸭蛋!”又比如大公无私型“钱财如粪土,我不感兴趣,你们一人50颗吧。” 如果他的方案得不到半数(包括他自己)或以上通过,他就要被扔到海里喂鲨鱼,然后小B继续提出他的方案。如果小B的方案得不到剩下一半或以上的通过,他也要被扔到海里喂鲨鱼。
基于以上规则,请问小A的最优方案是什么?我们这里排除任何道德因素,假定三个海盗都绝顶聪明,都想最大化自己的收益。
答案非常简单,用动态规划思想,逆序求解。我们假定只剩下小C,那么他自动获得100颗钻石。
现在我们后退一步,假定只剩下小B和小C (小A由于他提的分配方案得到B和C的一致否定而被丢到大海里啦。) 这时小B漏出一脸邪恶的笑容: “嘿嘿,我100颗,你鸭蛋一个!” 这个方案最优,因为剩下仅仅两人,小B自己的票数已经保证方案通过。
小C独自望洋兴叹:“哎,A啊,我多么地后悔,为啥刚刚不同意你呢?还不是因为你太贪了,想独占。” 小A听到小C的哭声,过去拍拍他的肩膀。小C吓了一跳,“你是人是鬼?你不是已经在鲨鱼肚子里面了吗?”
小A:“你痴线啊?[请用广东话读] 这不还在假定推理阶段嘛。这样吧,我拿99颗,你1颗,小B鸭蛋,如何?” 小C很不甘心:“凭什么我1颗,你99颗?信不信我投你否决票?”小A笑而不语。小C快速脑补了一下只剩小B和自己的场景,然后咬牙切齿、内心万头神兽奔腾而过地表示紧密团结在小A身边,完全赞成小A的决定。
例子讲完,这个和我们人生的规划有何关系呢?关系可大了。
施姐: 有点意思。为什么那三个海盗要这么分配呢?后面两个一人50个不就好了吗?第一个也不会得逞啊?而且相比第一个提出的方案后面两个都得到更多啊。搞不懂。
施弟: 。。。
例二: 小A想在一年后推出一款扫地机器人产品。为了达到这个目标,第11个月时,最终产品雏形必须完成,因为调试修改至少需要一个月时间。为了达到第11个月的目标,第10个月时,产品设计方案必须完成,因为从设计到生产至少需要一个月的时间。为了达到第10个月的目标,第九个月时,机械、控制、图形界面、嵌入式系统开发等重要的部分设计必须完成,因为各部分子系统整合至少需要一个月的时间。。。以此类推,小A发现,第一个月必须完成产品规格、性能、以及初步技术路线的调研,确定思路。
例三: 小B刚刚开始读博士,初步目标是在四年内至少发表一篇顶级杂志文章。他想了一下,一般文章从投稿到被接受少则半年,多则几年,平均也要一年多,那么至少在第三年的时候文章必须要投出去。写一篇好文章至少一年时间,那么第二年就要开始酝酿、推导、写作。哎,妈呀,就一年时间读书打基础、学做研究了。赶紧干活去!少壮不努力,老大徒伤悲啊!
施姐: 有点意思。一般我们定计划好像都是顺着时间定,小学怎么样,到了中学又怎么样,大学怎么样,诸如此类。这个逆序求解还挺好玩。对了,刚刚两个例子里面的小A和小B是那两个海盗吗?他们为什么不打打杀杀而去搞机器人和读博士了?
施弟: 。。。
简而言之,动态规划的核心思想是确定一个优化目标,然后反向迭代,进而确定当下每一刻的最优选择和行动。
方法介绍了,也比较容易懂。这部分最难的其实是目标的设定,而这个我就帮不上忙了,要自己安排,量体裁衣,因为每个人的幸福指数、人生轨迹、成长与学习的环境、以及目标函数都不一样。
课后作业:
(1) 如果是四个海盗,怎么分钻石呢?五个呢?
(2) 你的五年职业目标、学习目标是什么?怎么实现呢?如何去规划每一年的任务呢?
欢迎各位童鞋踊跃留言提问,我不负责解答,就算回答了也不包您满意。
以上是关于控制与人生: 上篇-规划篇 动态规划的主要内容,如果未能解决你的问题,请参考以下文章