对 游戏 《 2048 》 的一些思考
Posted Hello_BeautifulWorld
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了对 游戏 《 2048 》 的一些思考相关的知识,希望对你有一定的参考价值。
游戏 《2048》 是 Gabriele Cirulli出品手机数字游戏, 以下给出百度介绍:
https://baike.baidu.com/item/2048/13383511?fr=aladdin
游戏的网上地址:
http://gabrielecirulli.github.io/2048/
github 上的源码地址:
https://github.com/gabrielecirulli/2048
今天,一位老友与我闲聊中提起了最近在玩的一个小程序,就是这个传说中的2048游戏,一开始并没有太在意,但是听老友多次提起也就有了一丢丢的兴趣, 老友提到要自己写一个程序来让电脑自己玩这个游戏,并给出了自己的一些想法,听了以后感觉蛮神奇和高大上的,其思想可以概括为使用遗传算法和神经网络对 该问题建模后 进行求解,也就是说使用某种算法对问题的解空间进行搜索, 这个想法咋一听起来感觉不错不错,细细想来又总感觉差一些什么,随后老友又具体的讲了一下想法,那就是采用两个神经网络 对 问题 求解, 一个负责棋子的 移动, 一个负责搜索, 总之,感觉这个想法和有名的alfago 下围棋方法很像,只不过很无奈,alfago 过于高大上 以至于只是听说过它的一些方法。
抱着好奇的态度我便打开了这个游戏的网址,直观感觉这个游戏很简单,随后我发现这个游戏和平时的棋盘类游戏还是有一些不同的。这个游戏的初始两个棋子的位置是完全随机的, 虽然棋子 可以是 2 和 4 中的任意一个(其中 , 是2 的概率为0.9, 是4 的概率为0.1), 但是这个初始状态可以看做是完全随机的, 然后每一次移动棋子后产生的棋子也是随机的(2 的概率为0.9, 是4 的概率为0.1), 并且位置也是随机的。也就是说,这个游戏在下棋过程中所有的操作都是随机的, 这个样子的话好像传统的那些解法不是很一样, 虽然说不上是简单了还是容易的。
对于这个游戏的解法我的观点不太同于我的老友,我总感觉这个游戏的步骤是需要算下到每一步位置后能够WIN的概率或者是下一步可以更好的概率。
这个游戏每次操作可以选择上 下 左 右 四个方向的操作,也就是4种可供选择。每次操作后空白 的 位置假设 为K, 那么也就是说这次操作后棋盘可能变化成的状态为 4 × k ×2, ( 2是因为 新生成的棋子可以是2 也可以是 4)。如果能够给出一个判断函数,来确定哪一种变化后的状态更优秀,当然还要考虑到变为该种状态的概率, 那么也就是说 我们要求 下个状态的优秀估值 和 概率的乘积, 即 期望值, 来选择 下一步的 操作。
有了以上想法后,本人决定亲自玩一次,给它打通关,结果万万没有想到 整整打了一天 也没有打赢, 真心是败给它了。随后,在网上搜了搜其他网友给出的解决方法,搜到了这个 不错的版本, 2048AI版本, 以下给出具体地址:
http://ovolve.github.io/2048-AI/
github 地址:
https://github.com/ovolve/2048-AI
以下给出演示图:
为了可以更好的理解该游戏是如何运行及设计的,本人在网上找了一个PYTHON版本的代码,当然由于其界面为命令行,其效果难以与JS写的相比,以下给出地址:
http://rosettacode.org/wiki/2048#Python
#!/usr/bin/env python3 import curses from random import randrange, choice # generate and place new tile from collections import defaultdict letter_codes = [ord(ch) for ch in \'WASDRQwasdrq\'] actions = [\'Up\', \'Left\', \'Down\', \'Right\', \'Restart\', \'Exit\'] actions_dict = dict(zip(letter_codes, actions * 2)) def get_user_action(keyboard): char = "N" while char not in actions_dict: char = keyboard.getch() return actions_dict[char] def transpose(field): return [list(row) for row in zip(*field)] def invert(field): return [row[::-1] for row in field] class GameField(object): def __init__(self, height=4, width=4, win=2048): self.height = height self.width = width self.win_value = 2048 self.score = 0 self.highscore = 0 self.reset() def reset(self): if self.score > self.highscore: self.highscore = self.score self.score = 0 self.field = [[0 for i in range(self.width)] for j in range(self.height)] self.spawn() self.spawn() def move(self, direction): def move_row_left(row): def tighten(row): # squeese non-zero elements together new_row = [i for i in row if i != 0] new_row += [0 for i in range(len(row) - len(new_row))] return new_row def merge(row): pair = False new_row = [] for i in range(len(row)): if pair: new_row.append(2 * row[i]) self.score += 2 * row[i] pair = False else: if i + 1 < len(row) and row[i] == row[i + 1]: pair = True new_row.append(0) else: new_row.append(row[i]) assert len(new_row) == len(row) return new_row return tighten(merge(tighten(row))) moves = {} moves[\'Left\'] = lambda field: \\ [move_row_left(row) for row in field] moves[\'Right\'] = lambda field: \\ invert(moves[\'Left\'](invert(field))) moves[\'Up\'] = lambda field: \\ transpose(moves[\'Left\'](transpose(field))) moves[\'Down\'] = lambda field: \\ transpose(moves[\'Right\'](transpose(field))) if direction in moves: if self.move_is_possible(direction): self.field = moves[direction](self.field) self.spawn() return True else: return False def is_win(self): return any(any(i >= self.win_value for i in row) for row in self.field) def is_gameover(self): return not any(self.move_is_possible(move) for move in actions) def draw(self, screen): help_string1 = \'(W)Up (S)Down (A)Left (D)Right\' help_string2 = \' (R)Restart (Q)Exit\' gameover_string = \' GAME OVER\' win_string = \' YOU WIN!\' def cast(string): screen.addstr(string + \'\\n\') def draw_hor_separator(): top = \'┌\' + (\'┬──────\' * self.width + \'┐\')[1:] mid = \'├\' + (\'┼──────\' * self.width + \'┤\')[1:] bot = \'└\' + (\'┴──────\' * self.width + \'┘\')[1:] separator = defaultdict(lambda: mid) separator[0], separator[self.height] = top, bot if not hasattr(draw_hor_separator, "counter"): draw_hor_separator.counter = 0 cast(separator[draw_hor_separator.counter]) draw_hor_separator.counter += 1 def draw_row(row): cast(\'\'.join(\'│{: ^5} \'.format(num) if num > 0 else \'| \' for num in row) + \'│\') screen.clear() cast(\'SCORE: \' + str(self.score)) if 0 != self.highscore: cast(\'HGHSCORE: \' + str(self.highscore)) for row in self.field: draw_hor_separator() draw_row(row) draw_hor_separator() if self.is_win(): cast(win_string) else: if self.is_gameover(): cast(gameover_string) else: cast(help_string1) cast(help_string2) def spawn(self): new_element = 4 if randrange(100) > 89 else 2 (i,j) = choice([(i,j) for i in range(self.width) for j in range(self.height) if self.field[i][j] == 0]) self.field[i][j] = new_element def move_is_possible(self, direction): def row_is_left_movable(row): def change(i): # true if there\'ll be change in i-th tile if row[i] == 0 and row[i + 1] != 0: # Move return True if row[i] != 0 and row[i + 1] == row[i]: # Merge return True return False return any(change(i) for i in range(len(row) - 1)) check = {} check[\'Left\'] = lambda field: \\ any(row_is_left_movable(row) for row in field) check[\'Right\'] = lambda field: \\ check[\'Left\'](invert(field)) check[\'Up\'] = lambda field: \\ check[\'Left\'](transpose(field)) check[\'Down\'] = lambda field: \\ check[\'Right\'](transpose(field)) if direction in check: return check[direction](self.field) else: return False def main(stdscr): curses.use_default_colors() game_field = GameField(win=32) state_actions = {} # Init, Game, Win, Gameover, Exit def init(): game_field.reset() return \'Game\' state_actions[\'Init\'] = init def not_game(state): game_field.draw(stdscr) action = get_user_action(stdscr) responses = defaultdict(lambda: state) responses[\'Restart\'], responses[\'Exit\'] = \'Init\', \'Exit\' return responses[action] state_actions[\'Win\'] = lambda: not_game(\'Win\') state_actions[\'Gameover\'] = lambda: not_game(\'Gameover\') def game(): game_field.draw(stdscr) action = get_user_action(stdscr) if action == \'Restart\': return \'Init\' if action == \'Exit\': return \'Exit\' if game_field.move(action): # move successful if game_field.is_win(): return \'Win\' if game_field.is_gameover(): return \'Gameover\' return \'Game\' state_actions[\'Game\'] = game state = \'Init\' while state != \'Exit\': state = state_actions[state]() curses.wrapper(main)
对于该游戏的 AI 版本, 外国技术网站上有以下的分析:
https://stackoverflow.com/questions/22342854/what-is-the-optimal-algorithm-for-the-game-2048/22389702#22389702
对于该游戏,个人的观点则是AI版本的重点是在各个评分函数的选择上,对此由于源码是JS写的,并不熟悉,再加上并无太多注解,对于外文论坛上的分析也是看得似懂非懂,不甚了了。
以上是关于对 游戏 《 2048 》 的一些思考的主要内容,如果未能解决你的问题,请参考以下文章