学界论名字的重要性之Bellman动态规划的命名

Posted 运筹OR帷幄

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了学界论名字的重要性之Bellman动态规划的命名相关的知识,希望对你有一定的参考价值。






『运筹OR帷幄』编译



编者按

现代科学的研究越来越强调学科之间的交叉,然而学科交叉不可避免的产生着很大的壁垒。每个人由于自己固有的学科背景和研究方向往往对其它学科抱有一些看法,例如搞纯数学研究的鄙视应用数学的,应用数学的鄙视搞统计的,搞统计的鄙视搞机器学习的,诸如此类举不胜举。Richard Bellman也曾经面临这样的问题,本文详细介绍了他如何通过起一个好名字来使动态规划的研究被广泛接受。



【学界】论名字的重要性之Bellman动态规划的命名
Richard Bellman

生平简介

美国数学家

美国国家科学院院士

动态规划的创始人


Bellman,1920年出生在纽约,1941年在布鲁克林学院获得学士学位,随后在威斯康星大学获得硕士学位。二战期间,他被分配到洛斯阿拉莫斯的一个理论物理分部工作,在数学和物理方面表现出极大的天赋。1946年,25岁的他从普林斯顿大学获得博士学位。1950初开始在德兰公司工作,正是在这段时间他提出了动态规划。他在1979年被授予电气电子工程师协会奖,由于其在“决策过程和控制系统理论方面的贡献,特别是动态规划的发明和应用。”


  在夹缝中开展应用

数学研究的Bellman 


在1949年的夏天,已是斯坦福大学数学系终身副教授的Bellman,对分析数论越来越感兴趣,他向圣莫尼卡的德兰公司申请工作,并在那里开展多阶段决策过程的研究。当时Bellman从传统数学的研究转向应用数学领域,也就是运筹学。在那个年代,应用数学研究者被认为是数学协会的二等公民。当被邀请去不同大学的数学研讨会上发言时,Bellman享受着争议并开心地为选择应用数学而非纯数学做辩护。在他看来,应用数学的存在是因为现实世界有更大的挑战以及更高的数学要求。



  动态规划的命名  


1950年的秋季学期,Bellman在德兰公司第一件事就是为多阶段决策过程命名。20世纪50年代对数学研究而言并非是有利的时机。当时的国防部长Wilson极其厌恶“research”这个词。如果有人当着他的面使用“research”这个词,他的脸色开始变红,然后会变得很暴躁。那么你可以想象一下他听到“mathematical”数学这个词时会有何反应。当时兰德公司被空军雇佣,而空军基本上是受控于Wilson。因此Bellman并不能让Wilson和空军知道他在德兰公司里做着与数学相关的研究。他希望能够给当前的研究内容——多阶段决定过程,确定一个合适的名字以掩人耳目。起初,Bellman对planning, decision making, thinking这三个词感兴趣。但出于种种原因,planning并不合适,反复斟酌后,他决定使用programming这个词。接下来,他进一步考虑哪个词可以体现该项研究的动态性,多阶段性和时变性。为此,他想到了一个一举两得的方法。dynamic这个词不但能准确地表达动态这个物理含义,而且具有形容词的词性,没有贬义的意思。Bellman想到一些词语组合后可能会有带有贬义的意思,但动态规划(dynamic programming)这个名字是他认为连国会会员都不会反对的好名字。


【学界】论名字的重要性之Bellman动态规划的命名



Dynamic Programming

因此,Bellman以动态规划作为保护伞,在德兰公司展开多阶段决策过程的数学研究。


Bellman对动态规划极为痴迷。他清楚地知道动态规划有许多好的分析方法以及很好的应用场景。他是一个传统知识分子,又是当代知识分子,能够利用动态规划解决当代社会问题。选择动态规划虽是个明智的决定,但同时这是一条危险的道路,很难平衡研究与应用之间的关系,Bellman本人有信心能做好这个奇妙的研究方向。



  动态规划和最优控制理论  



Bellman解决动态规划的第一个任务是将其置于严谨的环境下。他发现自己一直在用同样的方法来推导函数方程,并决定称这种方法为最优化原理(principle of optimality)。


Bellman承认这个原理并不严谨,也不精确,一个好的原理、准则应该是指导直觉的。其次,他对相关函数方程进行了研究。这些函数方程都是高度非线性的,与在分析数学中出现的其它方程都不相同。他非常自豪可以找到一个可以解决大多数函数方程的简单方法,这个方法就是变分法。变分法虽然简单,但是需要极大的独创性。问题的微小变化会引起方程解的极大改变。但是,Bellman发现变分法并不是解决该问题的有效方法,方程两端明显缺乏平衡。为了解决变分法的问题,Bellman在动态规划函数方程上花费了大量的时间和精力,如何获得最优化问题的数值解以及方法的可靠性等棘手的问题一直在困扰他。后来他发现了动态规划与控制理论之间有趣的关联性,并提出了最优控制理论。


直到今天动态规划依然有着非常旺盛的生命力,在运筹学领域动态规划被广泛的应用,在控制论领域也常用动态规划求解最优控制问题,在机器学习领域动态规划也衍生出了近似动态规划(Approximate dynamic programming,ADP),近似动态规划又被称为强化学习,目前也是机器学习活跃的一个分支。


参考文献:

Dreyfus S. Richard Bellman on the Birth of Dynamic Programming[J]. Operations Research, 2002, 50(1):48-51.

https://en.wikipedia.org/wiki/Richard_E._Bellman


—— 完 ——


温馨提示

文章相关

责任编辑:布鲁斯盖

微信编辑:葡萄

友情提醒:本文由运筹OR帷幄编译整理,如有内容侵权,随时删除。

往期好文推荐

No.1丨

No.2丨

No.3丨

No.4丨

板块招聘



点击阅读原文,了解更多


以上是关于学界论名字的重要性之Bellman动态规划的命名的主要内容,如果未能解决你的问题,请参考以下文章

动态规划学习

算法分析之动态规划

动态规划之记忆的作用

动态规划基本思想

学界0-1背包问题的动态规划算法

Bellman ford和SPFA算法全解析,从动态规划到队列贪心