计算机博弈 蒙特卡洛模拟

Posted _刘文凯_

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了计算机博弈 蒙特卡洛模拟相关的知识,希望对你有一定的参考价值。

计算机博弈大赛中 蒙特卡洛模拟算法是一种简单有效的算法

预备知识:
多线程技术(没有也行)
博弈游戏规则

思想:
蒙特卡洛算法的特征是“基于大量的随机的模拟”,意思是AI在搜索过程中,所有的棋步都是随机产生的。当轮到A下时,A的落棋随机产生,当轮到B下时,B的落棋也随机产生,直到该盘胜负已定。假如现在AI要判断出A的最佳走步,而A当前有三个可以走的棋步,于是AI对这三个走步情况进行大量随机模拟,发现其中某个走步的胜率最高,所以这个走步是最优的。

图解:

改进
基于蒙特卡洛模拟的博弈方法比较简单,因此有众多的改进算法:
季辉,等:双人博弈问题中的蒙特卡洛树搜索算法的改进
一个幻影围棋计算机博弈系统的设计与实现

这些算法大多结合了之前讲解的阿尔法-贝塔剪枝算法,可以构建更加有效的模型。

以上是关于计算机博弈 蒙特卡洛模拟的主要内容,如果未能解决你的问题,请参考以下文章

蒙特卡洛方法

蒙特卡洛算法

蒙特卡洛方法原理

使用蒙特卡罗模拟多线程计算 Pi

数据分析之蒙特卡洛模拟

用 Python 中的蒙特卡洛模拟预测股票收益