《纳什均衡与博弈论》纳什博弈论及对自然法则的研究

Posted 白鳯

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了《纳什均衡与博弈论》纳什博弈论及对自然法则的研究相关的知识,希望对你有一定的参考价值。

《纳什均衡与博弈论》纳什博弈论及对自然法则的研究

纳什,《美丽心灵》男主

摘录

  • 如果说在17世纪,自然哲学家们借助人类世界的法则来研究自然界,那么到了18世纪,就是自然界的定律帮祝我们更好地了解人类生活的时候。 ——罗杰·史密斯《诺顿人类科学史》

  • 冯·诺依曼和摩根斯特恩指出:“大数目通常要比小规模的数目更容易处理。”

  • 通常,要想让博弈论发挥作用,混合策略是不可或缺的。

  • 打扑克牌时,虚张声势不可不免。

  • 在二人零和博弈中使用最小最大化原理的奥秘在于,你要铭记,一方赢得什么,另一方就要失去什么(这就是零和博弈的定义)。(在零和博弈中数字代表矩阵左方的局中人的收益)

  • 纳什的非合作博弈理论被公认为20世纪人类最杰出的智力成果之一,其意义可与生物界的DNA双螺旋结构的发现向媲美。 ——经济学家罗杰·迈尔森

  • 纳什均衡理论:在其他玩家的策略不变时,每个玩家采取的混合策略都最大化其自身收益。

    (百度百科:纳什均衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。纳什证明了在每个参与者都只有有限种策略选择并允许混合策略的前提下,纳什均衡定存在。)

  • 博弈论中的经典问题:囚徒困境,爱丽丝和鲍勃相关,梅耶的硬币(量子与博弈论)

  • 以牙还牙策略

  • 瑞德·蒙特格的“人类神经影像实验室”,“将精神和人类经验量化,将感觉转换为数字。”

  • “信任,是经济学家已经找到的和经济增长最为相关的因素之一” ——扎克

  • 利己主义者敢说各种各样的话和扮演各种各样的角色。 ——拉罗什富科

  • 乌合之众人多而智寡。 ——英国谚语

  • 不管现实中的人多么变幻莫测,他的行为总是浩瀚宇宙有序体系的一部分。 ——亨利·汤马斯·巴克尔

  • 凯特勒(1796生于根特),发明了衡量肥胖的凯特勒指标,即体重指数,简称BIM

  • 历史学家亨利·汤马斯·巴克尔(1821生于伦敦),是一流的国际象棋棋手,能够熟练使用七种语言,并熟知十几门语言,也是收藏丰富的藏书家,藏书超过20000本。

    巴克尔认为:偶尔有人的决策看起来是自由的,甚至是令人惊讶的,那是因为你不了解他的处境。“如果我能够正确推理,同时对他的处境了如指掌,我就能预测由这些处境引发的一系列行为。“

  • 博弈论的成功之处在于证明了纯策略的概率分布(混合策略)能够使效应最大化(或损失最小化),特别当你的对手是理性的时候(意味着他们也采取混合策略)。

  • 科林·卡莫热指出:“博弈论是描述社会相互作用的数学语言,它为此而生。”

  • 是博弈论深及物理学,还是物理学深及博弈论?皆有可能。但令人惊奇的却是,量子物理可能在最基本的层次上成为两者的纽带。 ——李周凡,尼尔·F·约翰逊,《物理世界》

  • 所有精确的科学都依赖于并不太精确的近似理念,这看似矛盾,却是事实所在。 ——伯特兰·罗素


第八章 培根的链接——网络、社会与博弈

与亚原子的粒子物理学或是宇宙的大尺度结构物理学不同,网络科学是现实世界的科学——一个关于人类、友谊、谣言、疾病、时尚、各类公司和金融危机的世界。 ——邓肯·瓦茨,《六度空间》

六度空间:任何连个陌生人都可以在“六度分离”之内被联系起来,五次周转。 (培根网络,培根是作为“枢纽”来联系其他人的)

不同网络的一种基本共同特征是它们中的很多都呈现出了小世界性质。

瓦茨和斯托加茨推断,“小世界现象不只是社会网络的特例或是人造的理想模型——它可能普遍存在于自然界中的各种大型、稀疏网络中。”

某个网络特征可以用类似气体的温度和压强那样的参数来量化,科学家称其为描述性系统变量。任意两个节点之间的平均步数——路径长度——就是这样一个参数。另一个是“聚合系数”——指的是如果两个点都和第三个相连接时,这两点直接相连的可能性。相对较高的聚合比例是小世界网络违反直觉的特征之一。小世界网络的路径长度和随机网络比较相似。另一方面,小世界网络的高聚合系数则和随机网路完全不同,反而更接近规则网络。

除了聚合系数和路径长度之外,另一个关键的数字是将一个节点和其他节点连接起来的平均连线数量,称为“级度系数”(节点的“级度”是该节点连接的其他节点数量)

个体的最优并能带来群体的最优。

“这个矛盾意味着用户最大化其适宜性的倾向实际上导致了适宜性的下降······”


纳什均衡计算

假设鲍勃欠爱丽丝10美元,在爱丽丝的游戏里,他们连续在一个月里面每个工作日都去图书馆一次。如果两个人都是乘车去的,那么鲍勃付给爱丽丝3美元;两人都走路去,则付4美元。鲍勃乘车而爱丽丝走路去,因而爱丽丝后到,鲍勃付5美元;鲍勃走路而爱丽丝鲍勃走路而爱丽丝乘车,因而爱丽丝先到,鲍勃付6美元。

在零和博弈中,收益矩阵中的数字代表矩阵左方的局中人的收益。爱丽丝的收益如下表

(鲍勃)乘车(鲍勃)步行
(爱丽丝)乘车36
(爱丽丝)步行54

1️⃣

现在假设爱丽丝选择乘车的概率为p,则步行的概率为1-p。

鲍勃选择乘车的概率为q。则他步行的概率为1-q。

因此

爱丽丝选择乘车的期望收益为 3 q + 6 ( 1 − q ) 3q+6(1-q) 3q+6(1q),选择步行的期望收益为 5 q + 6 ( 1 − q ) 5q+6(1-q) 5q+6(1q)

用相似的推理来计算鲍勃的期望收益可以得到:

鲍勃选择乘车的期望收益为 − 3 p + [ − 5 ( 1 − p ) ] -3p+[-5(1-p)] 3p+[5(1p)],选择步行的期望收益为 − 6 p + [ − 4 ( 1 − p ) ] -6p+[-4(1-p)] 6p+[4(1p)]

要达到纳什均衡,他们做两种选择的概率必须使得对这两个概率的任何改变都无法带来更多收益。

对爱丽丝来说,若鲍勃不改变策略,则
− 3 p + [ − 5 ( 1 − p ) ] = − 6 p + [ − 4 ( 1 − p ) ] -3p+[-5(1-p)]=-6p+[-4(1-p)] 3p+[5(1p)]=6p+[4(1p)]
解得p=1/4。所以对于爱丽丝来说,她选择乘车的最优概率为1/4,对应步行的最优概率为3/4。

若爱丽丝不改变策略,对鲍勃来说,同理可解得q=1/2。所以鲍勃应该在一半时间乘车,一半时间步行。

2️⃣

(鲍勃)乘车(鲍勃)步行
(爱丽丝)乘车36
(爱丽丝)步行54

对鲍勃来说,他在选择特定策略的时候爱丽丝选择的策略收益差为-2和2(行数据相减),比例为1:1,可得鲍勃最佳策略为一半乘车,一半步行。

对爱丽丝来说,她在选取特定策略的时候鲍勃采用策略的收益差为-3和1(列数据相减),比例为3:1,可得爱丽丝的最佳策略为1/4时间乘车,3/4时间步行。

.

可以看出,在二人零和博弈中,在很多情况下,最佳策略即混合策略

以上是关于《纳什均衡与博弈论》纳什博弈论及对自然法则的研究的主要内容,如果未能解决你的问题,请参考以下文章

纳什均衡和帕累托最优

纳什均衡,公式转化

博弈论笔记1:囚徒困境与纳什均衡

数学建模暑期集训14:博弈论与纳什均衡

三十分钟理解博弈论“纳什均衡” -- Nash Equilibrium

占优策略、重复剔除优势、纳什均衡三者的内在联系和区别是啥?