两人零和博弈的纳什均衡

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了两人零和博弈的纳什均衡相关的知识,希望对你有一定的参考价值。

纳什均衡简单的理解:在这种策略下,任何一位玩家都不愿意单方面的改变自己的策略。

本系列讨论:如何用代码计算两人零和博弈的纳什均衡

例如这样一个赌局

规则:两人各自亮出硬币的一面。如果两人都是正面,那么A给B3元,如果两人都是反面,A给B1元,剩下的情况B给A2元。

这个赌局看似公平,但其实非也。

分析:假设A以p1、p2的概率出正面、反面。

当B出正面时,A的收益为:w1=-3元*p1+2元*p2

当B出反面时,A的收益为:w2=2元*p1-1元*p2

令w1=w2

得p1=3/8,w1=w2=1/8

可见,A可以通过合理的策略获得优势。

当然,我们也可以用代码来解决问题。

以上是关于两人零和博弈的纳什均衡的主要内容,如果未能解决你的问题,请参考以下文章

DeepMind VS Meta:实现纳什均衡理性最优解,还是多人非零和博弈算法更强大?

计算纳什均衡

博弈论笔记1:囚徒困境与纳什均衡

《纳什均衡与博弈论》纳什博弈论及对自然法则的研究

《纳什均衡与博弈论》纳什博弈论及对自然法则的研究

纳什均衡和帕累托最优