minimax定理证明
Posted MatrixCancer
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了minimax定理证明相关的知识,希望对你有一定的参考价值。
本文目录
#minimax定理成立与纳什均衡的等价性
选取
p
∗
p^*
p∗ 使得
min
q
U
(
p
∗
,
q
)
=
max
p
min
q
U
(
p
,
q
)
\\min\\limits_q U(p^*,q) = \\max\\limits_p \\min\\limits_q U(p,q)
qminU(p∗,q)=pmaxqminU(p,q)
选取
q
∗
q^*
q∗ 使得
max
p
U
(
p
,
q
∗
)
=
min
q
max
p
U
(
p
,
q
)
\\max\\limits_p U(p,q^*) = \\min\\limits_q \\max\\limits_p U(p,q)
pmaxU(p,q∗)=qminpmaxU(p,q)
max p min q U ( p , q ) = min q max p U ( p , q ) ⟹ MNE \\max\\limits_p \\min\\limits_q U(p,q) = \\min\\limits_q \\max\\limits_p U(p,q) \\implies \\textMNE pmaxqminU(p,q)=qminpmaxU(p,q)⟹MNE
由于
max
p
min
q
U
(
p
,
q
)
=
min
q
max
p
U
(
p
,
q
)
\\max\\limits_p \\min\\limits_q U(p,q) = \\min\\limits_q \\max\\limits_p U(p,q)
pmaxqminU(p,q)=qminpmaxU(p,q)
因此
min
q
U
(
p
∗
,
q
)
=
max
p
U
(
p
,
q
∗
)
\\min\\limits_q U(p^*,q) = \\max\\limits_p U(p,q^*)
qminU(p∗,q)=pmaxU(p,q∗)
-
由于 ∀ p ∈ Δ p \\forall p \\in \\Delta_p ∀p∈Δp, U ( p , q ∗ ) ⩽ max p U ( p , q ∗ ) = min q U ( p ∗ , q ) ⩽ U ( p ∗ , q ∗ ) U(p,q^*) \\leqslant \\max\\limits_p U(p,q^*) = \\min\\limits_q U(p^*,q) \\leqslant U(p^*,q^*) U(p,q∗)⩽pmaxU(p,q∗)=qminU(p∗,q)⩽U(p∗,q∗)
因此 p ∗ p^* p∗ 是 q ∗ q^* q∗ 的最优反应 -
由于 ∀ q ∈ Δ q \\forall q \\in \\Delta_q ∀q∈Δq, U ( p ∗ , q ) ⩾ min q U ( p ∗ , q ) = max p U ( p , q ∗ ) ⩾ U ( p ∗ , q ∗ ) U(p^*,q) \\geqslant \\min\\limits_q U(p^*,q) = \\max\\limits_p U(p,q^*) \\geqslant U(p^*,q^*) U(p∗,q)⩾qminU(p∗,q)=pmaxU(p,q∗)⩾U(p∗,q∗)
因此 q ∗ q^* q∗ 是 p ∗ p^* p∗ 的最优反应
因此 ( p ∗ , q ∗ ) (p^*,q^*) (p∗,q∗) 构成纳什均衡.
max p min q U ( p , q ) = min q max p U ( p , q ) ⟸ MNE \\max\\limits_p \\min\\limits_q U(p,q) = \\min\\limits_q \\max\\limits_p U(p,q) \\impliedby \\textMNE pmaxqminU(p,q)=qminpmaxU(p,q)⟸MNE
由于
U
(
p
,
q
)
⩽
max
p
U
(
p
,
q
)
U(p,q) \\leqslant \\max\\limits_p U(p,q)
U(p,q)⩽pmaxU(p,q)
所以
min
q
U
(
p
,
q
)
⩽
min
q
max
p
U
(
p
,
q
)
\\min\\limits_q U(p,q) \\leqslant \\min\\limits_q \\max\\limits_p U(p,q)
qminU(p,q)⩽qminpmaxU(p,q)
进而
max
p
min
q
U
(
p
,
q
)
⩽
min
q
max
p
U
(
p
,
q
)
\\max\\limits_p \\min\\limits_q U(p,q) \\leqslant \\min\\limits_q \\max\\limits_p U(p,q)
pmaxqminU(p,q)⩽qminpmax以上是关于minimax定理证明的主要内容,如果未能解决你的问题,请参考以下文章
@算法 - 7@ matrix - tree 定理(矩阵树定理)