[CSP校内集训]贪吃蛇（阿尔法-贝塔剪枝）

Posted 2020-11-15 chtholly

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了[CSP校内集训]贪吃蛇（阿尔法-贝塔剪枝）相关的知识，希望对你有一定的参考价值。

题目

有两条蛇(1号蛇和2号蛇)在n行m列的地图上,地图上有障碍物。一条蛇碰到蛇身/障碍物/边界就会死。蛇身会不断长长——可以理解为蛇尾位置不会变,蛇只会向前伸展不会缩尾巴。两条蛇都绝顶聪明,如果自己能赢,一定会尽量快地赢;如果自己会输,一定会死得尽量晚。给出初始局面,两蛇轮流走,每次可以且必须向上下左右移动一格。1号蛇先走,请告诉我谁会在多少回合时赢。((n,mleq 20))且(0)的数量不超过(50)

(alpha - eta)剪枝

AlphaBeta剪枝算法是一个搜索算法，旨在减少在其搜索树中，被极大极小算法评估的节点数。
这是一个常用人机游戏对抗的搜索算法。它的基本思想是根据上一层已经得到的当前最优结果，决定目前的搜索是否要继续下去——百度百科

前提：双方绝顶聪明，各自为营

~~用我的话来说~~，这个剪枝方法是这样的一个结构：

所有的估价都是由同一个角度来看待的，不能说在1的回合说对1有利，在2的回合又说对2有利（应该说对1有害）
搜索树上先手通过一条边转移成后手
搜索树的叶子节点是估价函数，评估到达的这个状态的好坏，函数值越大对先手越有利，父亲节点的权值均由儿子转移来
奇偶性不同的层求的东西不一样，即两个人的策略不同，先手求的是所有儿子中最大的一个（即对先手最有利），后手求的是最小的一个（对先手最有害）

总而言之，就是搜索树的奇数层节点取(max)，偶数层取(min)，叶子节点需要自己估价（根据具体的题目）

扯了半天，如何剪枝？很简单，比如对于先手节点(u)，它会取最大的儿子，假设当前权值为(ans_u)，如果当前节点的儿子(v)的一个儿子(vv)权值小于(ans_u)，就不用再遍历这个儿子(v)剩下的儿子了（因为儿子(v)的权值取(min){孙子})，这个儿子(v)的权值到目前为止可以判断一定小于(ans_u)了；后手相反（可能会有点抽象，建议画图理解）

本题思路

本题显然可以用(alpha - eta)剪枝（双方绝顶聪明且操纵的蛇不一样）

主要是估价函数的设计：如果先手无路可走，就是绝对有害，设为(-inf)，但又活的越久越好，所以还要加上一个存活时间(step)，后手同理

这个剪枝还是比较简单好理解的，主要注意不要把先后大小关系搞反了就行

Code（即本题的标程）

#include<bits/stdc++.h>
#define N 25
#define Min(x,y) ((x)<(y)?(x):(y))
#define Max(x,y) ((x)>(y)?(x):(y))
using namespace std;
const int INF = 10000;
int n,m,a[N][N],sx[2],sy[2];
int dox[4]={0,1,0,-1},doy[4]={1,0,-1,0};

template <class T>
void read(T &x)
{
    char c;int sign=1;
    while((c=getchar())>'9'||c<'0') if(c=='-') sign=-1; x=c-48;
    while((c=getchar())>='0'&&c<='9') x=x*10+c-48; x*=sign;
}
int dfs(int step,int player,int alpha,int beta,int fx,int fy,int px,int py)//alpha是下界只降不增，beta是上界只增不降 
{
    bool flag=false;
    int ans=(player==1 ? beta : alpha);//如果是1就会选尽量大 
    for(int i=0;i<4;++i)
    {
        int dx=fx+dox[i],dy=fy+doy[i];
        if(dx<1||dy<1||dx>n||dy>m||a[dx][dy]) continue;
        flag=true;
        a[dx][dy]=1;
        int now=0;
        if(player==1) now=dfs(step+1,2,alpha,ans,px,py,dx,dy);//1号 
        else now=dfs(step+1,1,ans,beta,px,py,dx,dy);
        a[dx][dy]=0;
        if(player==1)//注意这里的玩家1在上面的剪枝中相当于后手的儿子
        {
            if(now>=alpha) return alpha;
            //如果now比最小值大，那么这个节点会贡献值一定大于等于now，而最小值一定不会考虑它 
            else ans=Max(ans,now);
        }
        else//它的父亲是先手，和上面讨论的一致
        {
            if(now<=beta) return beta;
            else ans=Min(ans,now);
        }
    }
    if(!flag)//移动不了，即到了叶子（输），需要估价
    {
        if(player==1) return -INF+step;//step越大先手活的越久，但总体上还是自己输了 
        else return INF-step;//step越大对于先手越坏，但总体上还是对面赢了 
    }
    return ans;
}
int main()
{
    freopen("h.in","r",stdin);
    freopen("h.out","w",stdout);
    read(n);read(m);
    for(int i=1;i<=n;++i)
      for(int j=1;j<=m;++j)
      {
        read(a[i][j]);
        if(a[i][j]==1) sx[0]=i,sy[0]=j;
        if(a[i][j]==2) sx[1]=i,sy[1]=j;
      }
    
    int ans=dfs(1,1,INF,-INF,sx[0],sy[0],sx[1],sy[1]);
    if(ans>0) printf("1 %d
",INF-ans);//最后到达的是2号对应的叶子，减掉INF还原 
    else printf("2 %d
",ans+INF);//最后到达的是1号对应的叶子，加上INF（这个见上面dfs中估价函数的计算） 
    return 0;
}

(learning from)：博客1，博客2

P.S. 笔者小白一枚，如有错误还请指出

以上是关于[CSP校内集训]贪吃蛇（阿尔法-贝塔剪枝）的主要内容，如果未能解决你的问题，请参考以下文章

[CSP校内集训]贪吃蛇（阿尔法-贝塔剪枝）

题目

(alpha - eta)剪枝

本题思路

Code（即本题的标程）

(alpha - eta)剪枝