围棋ai()是基于alphabeta剪枝算法的。

Posted 2023-03-20

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了围棋ai()是基于alphabeta剪枝算法的。相关的知识，希望对你有一定的参考价值。

参考技术A GNUGo
阿尔法围棋（AlphaGo）是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能机器人，由谷歌（Google）旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发。其主要工作原理是“深度学习”。

[程序设计]-基于人工智能博弈树，极大极小(Minimax)搜索算法并使用Alpha-Beta剪枝算法优化实现的可人机博弈的AI智能五子棋游戏。

绪论-五子棋的特点与规则

五子棋是两方之间进行的竞技活动，专用棋盘为15*15，五连子的方向为横、竖、斜；任一方在棋盘上形成横向、竖向、斜向的连续的相同颜色的五个（含五个以上）时即为该方胜利；在棋盘上以对局双方均不可能形成五连为和棋。黑白双方依次落子，由黑方先下，由于先下一方在局面上占优，所以五子棋规则分为禁手和无禁手两种。

禁手规则：禁手是针对先行的黑棋而言，以限制黑棋的先行优势为目的。对局中如果黑棋违反禁手规则将被判负。以中国五子棋竞赛规则为例，有三三禁手（黑棋一子落下时同时形成两个或两个以上的活三，此子必须为两个活三共同的构成子）、四四禁手（黑棋一子落下同时形成两个以上的冲四或活四）、长连禁手（黑棋一子落下形成一个或一个以上的长连）。无禁手指不对黑棋的先行优势做任何限制。

表4.1.1 常见的棋盘术语

概念	概念描述
阳线	直线，棋盘上可见的横纵直线。
阴线	斜线，由交叉点构成的与阳线成45°夹角的隐形斜线。
长连	五枚以上同色棋子在一条阳线或阴线上相邻成一排。
活四	有两个点可以成五的四。
冲四	只有一个点可以成五的四。
死四	不能成五的四。
活三	再走一着可以形成活四的三。
眠三	再走一着可以形成冲四的三。
死三	不能成五的三。

程序设计运行流程图

为实现以上程序的正常运行，程序设计开发出了，初始化模块，图形界面模块，游戏规则模块，AI函数处理模块等。这些模块的具体设计将在下一章内详细介绍。

AI算法的具体实现

创建minimax的节点

搜索时的一个节点，需要创建一个minimax的节点，节点需要考虑的要素有：

param game: 游戏内容。是Game类的一个对象
    param ope:               这一步的操作是什么
    param depth: 当前节点的深度
    param alpha:                这个节点初始的alpha值
    param beta: 这个节点初始的beta值
    param force_score: 是否必须算出一个分数
    param player_first:        是否玩家先出

对节点的评价分析

结合上文对于五子棋对弈的特点与规则的介绍，我们可以构造出一个合适的评价函数，通过评价函数估值AI下载棋盘上的每一步的价值，从而AI可以选择出每个对弈回合中最有利于AI的落子位置。

计算这个节点的分数。对AI越有利则分数越高，反之分数越低。

如果能够连成五子，则记为100分

      判断玩家和电脑的四子的数目（需要保证：不是已经被堵死的四子）

如果能够连成活四，或连成双四，则记为90分

      如果能够连成四三，则记为80分

      如果能够连成四子，则记为70分

      如果能够连成双三，则记为60分

如果能够连成单活三，则记为50分

其他情况。按照棋子的分布来计分（根据这个棋子距离棋盘中心的距离，以及这个棋子周围8格棋子的个数来评分）

如代码所示的为如果能够连成活四，或连成双四，则记为90分的节点评价的设计情况。

实现搜索算法的优化

按照minimax和alpha-beta剪枝的方法搜索一个根节点下的最优结果。
param cur_node_dx: 当前节点的索引值
param ope_hist: 假象的历史状态列表
param max_depth: 最大允许的深度。

优化算法的主要设想

1.首先确认什么地方可以落子。

落子的条件是：这个格子必须为空，周围8格内必须有至少一个棋子。
2.然后对每一个可以落子的格子进行搜索

2.1 创建一个子节点，并计算这个子节点的分数
        a.对于非最终层的节点，不急于立即算出分数，
        b.把这个节点插入到搜索树中，
        c.将这个新节点记录为当前节点的子节点，
        d.记录每个节点下一步的动作。

2.2根据子节点的情况，进行父节点的后续操作
        a.子节点有具体分数的情况下，就不用再进行更深层的迭代了
        b.假想中玩家走的，因此需要让分数尽量小，且应该修改beta值
        c.假想中电脑走的，因此需要让分数尽量大，且应该修改alpha值
        d.子节点还没有具体分数的情况下，应该以这个子节点为下一层的根节点，进行递归，之后再进行计算

2.3根据递归后计算的结果，计算这个节点的分数
f.假想中玩家走的，因此需要让分数尽量小，且应该修改beta值
g.假想中玩家走的，因此需要让分数尽量小，且应该修改beta值

3.alpha-beta剪枝实现搜索优化

程序运行的模块代码调用过程

程序运行主要由五个模块组成，分别为：初始化模块、图形界面模块、游戏规则界面、AI函数处理，主函数模块。

初始化模块

初始化模块：对应程序中conner_widget.py，主要就是做一个程序的运行背景，对棋盘的初始化。

图形界面模块

图形界面模块是运行中的窗口显示，主要功能函数及解释如下：

def run_with_exc(f): 游戏运行出现错误时，用messagebox把错误信息显示出来

        init_ui()  # 初始化游戏界面

        self.g = Gomoku()  # 初始化游戏内容

        self.res = 0  # 记录那边获得了胜利

       self.operate_status = 0 

# 游戏操作状态。0为游戏中（可操作），1为游戏结束闪烁过程中（不可操作）



def init_ui(self): 初始化游戏界面

  1. 确定游戏界面的标题，大小和背景颜色

        self.setPalette(palette)

2. 开启鼠标位置的追踪。并在鼠标位置移动时，使用特殊符号标记当前的位置

        self.setMouseTracking(True)

  3. 鼠标位置移动时，对鼠标位置的特殊标记

        self.corner_widget = CornerWidget(self)

        self.corner_widget.repaint()

        self.corner_widget.hide()

  4. 游戏结束时闪烁的定时器

        self.end_timer = QTimer(self)

        self.end_timer.timeout.connect(self.end_flash)

        self.flash_cnt = 0  # 游戏结束之前闪烁了多少次

        self.flash_pieces = ((-1, -1), )  # 哪些棋子需要闪烁

   5. 显示初始化的游戏界面

        self.show()



def paintEvent(self, e):绘制游戏内容

def draw_map():""绘制棋盘"""棋盘的颜色为黑色（绘制横线，竖线

def draw_pieces(): 绘制棋子



def mouseMoveEvent(self, e):

     1. 首先判断鼠标位置对应棋盘中的哪一个格子

     2. 然后判断鼠标位置较前一时刻是否发生了变化

     3. 最后根据鼠标位置的变化，绘制特殊标记


def mousePressEvent(self, e):根据鼠标的动作，确定落子位置

def end_flash(self) 游戏结束时的闪烁操作

def game_restart(self, res):游戏出现开始

游戏规则模块

游戏规则模块主要就是对游戏规则的说明：

class Gomoku:

def __init__(self):

        self.g_map = [[0 for y in range(15)] for x in range(15)]  # 当前的棋盘

        self.cur_step = 0  # 步数

        self.max_search_steps = 3  # 最远搜索2回合之后

def move_1step(self, input_by_window=False, pos_x=None, pos_y=None):玩家落子

        :param input_by_window: 是否从图形界面输入

        :param pos_x: 从图形界面输入时，输入的x坐标为多少

        :param pos_y: 从图形界面输入时，输入的y坐标为多少

def game_result(self, show=False):

判断游戏的结局。0为游戏进行中，1为玩家获胜，2为电脑获胜，3为平局。
主要用于判断是否横向连续五子，判断是否纵向连续五子，判断是否有左上-右下的连续五子，判断是否有右上-左下的连续五子，判断是否为平局。

def ai_move_1step(self):""电脑落子""

def ai_play_1step_by_cpp(self):判断下一步的操作

def show(self, res):""显示游戏内容""

def play(self):用户玩游戏

AI函数处理模块

AI函数处理模块：用到Alpha-Beta算法。

class Node:AI搜索时的一个节点

def __init__(self, game, ope, depth, alpha, beta, force_score, player_first):

        创建一个minimax的节点，

:param game: 游戏内容。是Game类的一个对象，

:param ope: 这一步的操作是什么，

:param depth: 当前节点的深度，

:param alpha: 这个节点初始的alpha值，

:param beta: 这个节点初始的beta值，

:param force_score: 是否必须算出一个分数，

:param player_first: 是否玩家先出。

     def calc_score(self):

        计算这个节点的分数。对AI越有利则分数越高，反之分数越低。

class AI1Step:落棋步骤

    def __init__(self, init_game, init_depth, player_first):

        决定AI这一步走什么地方，

:param init_game: 初始的游戏地图，

:param init_depth: 初始的深度，

:param player_first: 玩家是否先出。

    def search(self, cur_node_dx, ope_hist, max_depth):

        按照minimax和alpha-beta剪枝的方法搜索一个根节点下的最优结果，

:param cur_node_dx: 当前节点的索引值，

:param ope_hist: 假象的历史状态列表，

:param max_depth: 最大允许的深.

主函数模块

主函数模块作为程序的入口，进行程序的运行。

def main():

app = QApplication(sys.argv)

ex = GomokuWindow()

sys.exit(app.exec_())

if __name__ == '__main__':

main()

程序的运行情况

整体运行情况不错，反应比较灵敏，但在后期由于棋子越来越多，程序对棋子所做的选择就越来越多，运行速度就会变慢。而在运行过程中也有极小的概率程序会异常中断，目前分析可能为内存占用过多触发了程序设置的内存限制而导致的。黑白某一方连成五子即为获胜，当棋子落满棋盘的时候会默认为平局。

以上是关于围棋ai()是基于alphabeta剪枝算法的。的主要内容，如果未能解决你的问题，请参考以下文章