围棋ai()是基于alphabeta剪枝算法的。

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了围棋ai()是基于alphabeta剪枝算法的。相关的知识,希望对你有一定的参考价值。

参考技术A GNUGo
阿尔法围棋(AlphaGo)是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人,由谷歌(Google)旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发。其主要工作原理是“深度学习”。

[程序设计]-基于人工智能博弈树,极大极小(Minimax)搜索算法并使用Alpha-Beta剪枝算法优化实现的可人机博弈的AI智能五子棋游戏。

绪论-五子棋的特点与规则

五子棋是两方之间进行的竞技活动,专用棋盘为15*15,五连子的方向为横、竖、斜;任一方在棋盘上形成横向、竖向、斜向的连续的相同颜色的五个(含五个以上)时即为该方胜利;在棋盘上以对局双方均不可能形成五连为和棋。黑白双方依次落子,由黑方先下,由于先下一方在局面上占优,所以五子棋规则分为禁手和无禁手两种。

禁手规则:禁手是针对先行的黑棋而言,以限制黑棋的先行优势为目的。对局中如果黑棋违反禁手规则将被判负。以中国五子棋竞赛规则为例,有三三禁手(黑棋一子落下时同时形成两个或两个以上的活三,此子必须为两个活三共同的构成子)、四四禁手(黑棋一子落下同时形成两个以上的冲四或活四)、长连禁手(黑棋一子落下形成一个或一个以上的长连)。无禁手指不对黑棋的先行优势做任何限制。

表4.1.1 常见的棋盘术语

概念

概念描述

阳线

直线,棋盘上可见的横纵直线。

阴线

斜线,由交叉点构成的与阳线成45°夹角的隐形斜线。

长连

五枚以上同色棋子在一条阳线或阴线上相邻成一排。

活四

有两个点可以成五的四。

冲四

只有一个点可以成五的四。

死四

不能成五的四。

活三

再走一着可以形成活四的三。

眠三

再走一着可以形成冲四的三。

死三

不能成五的三。


 程序设计运行流程图

为实现以上程序的正常运行,程序设计开发出了,初始化模块,图形界面模块,游戏规则模块,AI函数处理模块等。这些模块的具体设计将在下一章内详细介绍。

AI五子棋运行流程图

 AI算法的具体实现

创建minimax的节点

搜索时的一个节点,需要创建一个minimax的节点,节点需要考虑的要素有:

    param game:                 游戏内容。是Game类的一个对象
    param ope:                    这一步的操作是什么
    param depth:                 当前节点的深度
    param alpha:                 这个节点初始的alpha值
    param beta:                   这个节点初始的beta值
    param force_score:       是否必须算出一个分数
    param player_first:        是否玩家先出

对节点的评价分析

结合上文对于五子棋对弈的特点与规则的介绍,我们可以构造出一个合适的评价函数,通过评价函数估值AI下载棋盘上的每一步的价值,从而AI可以选择出每个对弈回合中最有利于AI的落子位置。

计算这个节点的分数。对AI越有利则分数越高,反之分数越低。

      如果能够连成五子,则记为100分

      判断玩家和电脑的四子的数目(需要保证:不是已经被堵死的四子)

      如果能够连成活四,或连成双四,则记为90分

      如果能够连成四三,则记为80分

      如果能够连成四子,则记为70分

      如果能够连成双三,则记为60分

      如果能够连成单活三,则记为50分

      其他情况。按照棋子的分布来计分(根据这个棋子距离棋盘中心的距离,以及这个棋子周围8格棋子的个数来评分)

如代码所示的为如果能够连成活四,或连成双四,则记为90分的节点评价的设计情况。


实现搜索算法的优化

按照minimax和alpha-beta剪枝的方法搜索一个根节点下的最优结果。
 param cur_node_dx: 当前节点的索引值
 param ope_hist: 假象的历史状态列表
 param max_depth: 最大允许的深度。

优化算法的主要设想


1.首先确认什么地方可以落子。

落子的条件是:这个格子必须为空,周围8格内必须有至少一个棋子。
2.然后对每一个可以落子的格子进行搜索


2.1 创建一个子节点,并计算这个子节点的分数
        a.对于非最终层的节点,不急于立即算出分数,
        b.把这个节点插入到搜索树中,
        c.将这个新节点记录为当前节点的子节点,
        d.记录每个节点下一步的动作。


2.2根据子节点的情况,进行父节点的后续操作
        a.子节点有具体分数的情况下,就不用再进行更深层的迭代了
        b.假想中玩家走的,因此需要让分数尽量小,且应该修改beta值
        c.假想中电脑走的,因此需要让分数尽量大,且应该修改alpha值
        d.子节点还没有具体分数的情况下,应该以这个子节点为下一层的根节点,进行递归,之后再进行计算


2.3根据递归后计算的结果,计算这个节点的分数
        f.假想中玩家走的,因此需要让分数尽量小,且应该修改beta值
        g.假想中玩家走的,因此需要让分数尽量小,且应该修改beta值


3.alpha-beta剪枝实现搜索优化


程序运行的模块代码调用过程

程序运行主要由五个模块组成,分别为:初始化模块、图形界面模块、游戏规则界面、AI函数处理,主函数模块。

初始化模块

初始化模块:对应程序中conner_widget.py,主要就是做一个程序的运行背景,对棋盘的初始化。

图形界面模块

图形界面模块是运行中的窗口显示,主要功能函数及解释如下:

def run_with_exc(f): 游戏运行出现错误时,用messagebox把错误信息显示出来

        init_ui()  # 初始化游戏界面

        self.g = Gomoku()  # 初始化游戏内容

        self.res = 0  # 记录那边获得了胜利

       self.operate_status = 0 

# 游戏操作状态。0为游戏中(可操作),1为游戏结束闪烁过程中(不可操作)



def init_ui(self): 初始化游戏界面

  1. 确定游戏界面的标题,大小和背景颜色

        self.setPalette(palette)

2. 开启鼠标位置的追踪。并在鼠标位置移动时,使用特殊符号标记当前的位置

        self.setMouseTracking(True)

  3. 鼠标位置移动时,对鼠标位置的特殊标记

        self.corner_widget = CornerWidget(self)

        self.corner_widget.repaint()

        self.corner_widget.hide()

  4. 游戏结束时闪烁的定时器

        self.end_timer = QTimer(self)

        self.end_timer.timeout.connect(self.end_flash)

        self.flash_cnt = 0  # 游戏结束之前闪烁了多少次

        self.flash_pieces = ((-1, -1), )  # 哪些棋子需要闪烁

   5. 显示初始化的游戏界面

        self.show()



def paintEvent(self, e):绘制游戏内容

def draw_map():""绘制棋盘"""棋盘的颜色为黑色(绘制横线,竖线

def draw_pieces(): 绘制棋子



def mouseMoveEvent(self, e):

     1. 首先判断鼠标位置对应棋盘中的哪一个格子

     2. 然后判断鼠标位置较前一时刻是否发生了变化

     3. 最后根据鼠标位置的变化,绘制特殊标记


def mousePressEvent(self, e):根据鼠标的动作,确定落子位置

def end_flash(self) 游戏结束时的闪烁操作

def game_restart(self, res):游戏出现开始

游戏规则模块

游戏规则模块主要就是对游戏规则的说明:

class Gomoku:

def __init__(self):

        self.g_map = [[0 for y in range(15)] for x in range(15)]  # 当前的棋盘

        self.cur_step = 0  # 步数

        self.max_search_steps = 3  # 最远搜索2回合之后

def move_1step(self, input_by_window=False, pos_x=None, pos_y=None):玩家落子

        :param input_by_window: 是否从图形界面输入

        :param pos_x: 从图形界面输入时,输入的x坐标为多少

        :param pos_y: 从图形界面输入时,输入的y坐标为多少

def game_result(self, show=False):

判断游戏的结局。0为游戏进行中,1为玩家获胜,2为电脑获胜,3为平局。
主要用于判断是否横向连续五子,判断是否纵向连续五子,判断是否有左上-右下的连续五子,判断是否有右上-左下的连续五子,判断是否为平局。

def ai_move_1step(self):""电脑落子""

def ai_play_1step_by_cpp(self):判断下一步的操作

def show(self, res):""显示游戏内容""

def play(self):用户玩游戏

AI函数处理模块

AI函数处理模块:用到Alpha-Beta算法。

class Node:AI搜索时的一个节点

def __init__(self, game, ope, depth, alpha, beta, force_score, player_first):

        创建一个minimax的节点,

:param game: 游戏内容。是Game类的一个对象,

:param ope: 这一步的操作是什么,

:param depth: 当前节点的深度,

:param alpha: 这个节点初始的alpha值,

:param beta: 这个节点初始的beta值,

:param force_score: 是否必须算出一个分数,

:param player_first: 是否玩家先出。

     def calc_score(self):

        计算这个节点的分数。对AI越有利则分数越高,反之分数越低。

class AI1Step:落棋步骤

    def __init__(self, init_game, init_depth, player_first):

        决定AI这一步走什么地方,

:param init_game: 初始的游戏地图,

:param init_depth: 初始的深度,

:param player_first: 玩家是否先出。

    def search(self, cur_node_dx, ope_hist, max_depth):

        按照minimax和alpha-beta剪枝的方法搜索一个根节点下的最优结果,

:param cur_node_dx: 当前节点的索引值,

:param ope_hist: 假象的历史状态列表,

:param max_depth: 最大允许的深.

主函数模块

主函数模块作为程序的入口,进行程序的运行。

def main():

    app = QApplication(sys.argv)

    ex = GomokuWindow()

    sys.exit(app.exec_())

if __name__ == '__main__':

    main()


程序的运行情况

整体运行情况不错,反应比较灵敏,但在后期由于棋子越来越多,程序对棋子所做的选择就越来越多,运行速度就会变慢。而在运行过程中也有极小的概率程序会异常中断,目前分析可能为内存占用过多触发了程序设置的内存限制而导致的。黑白某一方连成五子即为获胜,当棋子落满棋盘的时候会默认为平局。

以上是关于围棋ai()是基于alphabeta剪枝算法的。的主要内容,如果未能解决你的问题,请参考以下文章

模型压缩:剪枝算法

[程序设计]-基于人工智能博弈树,极大极小(Minimax)搜索算法并使用Alpha-Beta剪枝算法优化实现的可人机博弈的AI智能五子棋游戏。

围棋AI之2020世界人工智能围棋大赛

五子棋AI算法第三篇-Alpha Beta剪枝

AI 开发神器来了!支持 CPU 加速优化!!

如何在使用 minimax 算法实现 2048 AI 代理中应用 alpha-beta 剪枝?