人工智能博弈

Posted zhousiyuan0515

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了人工智能博弈相关的知识,希望对你有一定的参考价值。

博弈行为:带有互相竞争性质的主体,为了达到各自目标和利益,采取的带有对抗性质的行为。

参与者:参与博弈的决策主体。

策略:参与者可以采取的行动方案,是一整套在爱去行动之前就已经准备好的完整方案。

  • 某个参与者可采纳策略的全体集合形成策略集;
  • 所有参与者各自采取行动后形成的状态被称为局势;
  • 如果参与者可以通过一定概率分布来选择若干个不同的策略,这样的策略称为混合策略。弱参与者每次行动都选择某个确定的策略,这样的策略称为纯策略;

收益:各个参与者在不同局势下得到的利益(混合策略下的收益为期望收益)

规则:对参与者行动的先后排序、参与者获得信息多少等内容的规定。

博弈的分类

合作博弈:部分参与者可以组成联盟以获得更大收益。

非合作博弈:参与者在决策中都彼此独立,不是先达成合作意向。

静态博弈:所有参与者同时决策,或参与者互相不知道对方的决策。

动态博弈:参与者所采取行为的先后顺序由规则决定,且后行动者知道先行动者所采取的行为。

完全信息博弈:所有参与者均了解其他参与者的策略集、收益等信息。

不完全信息博弈:并非所有参与者均掌握了所有信息。

nash定理:若参与者有限,每位参与者的策略集有限,收益函数为实值函数,则博弈比存在混合策略意义下的nash均衡。

遗憾最小化算法

策略选择:

虚拟遗憾最小化算法

 

以上是关于人工智能博弈的主要内容,如果未能解决你的问题,请参考以下文章

人工智能之人机博弈

强化学习|多智能体深度强化学习(博弈论—>多智能体强化学习)

智能与人工的博弈,究竟鹿死谁手

[程序设计]-基于人工智能博弈树,极大极小(Minimax)搜索算法并使用Alpha-Beta剪枝算法优化实现的可人机博弈的AI智能五子棋游戏。

短信验证码要被淘汰?人工智能与验证码的博弈

智能控制导论雪堆博弈-最小节点覆盖问题