gym强化学习入门demo——随机选取动作 其实有了这些动作和反馈值以后就可以用来训练DNN网络了

Posted bonelee

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了gym强化学习入门demo——随机选取动作 其实有了这些动作和反馈值以后就可以用来训练DNN网络了相关的知识,希望对你有一定的参考价值。

 

# -*- coding: utf-8 -*-
import gym
import time
env = gym.make(‘CartPole-v0‘)
observation = env.reset()
print(observation)

print("env actionspace:")
print(env.action_space)

print("env observationspace:")
print(env.observation_space)
print(env.observation_space.high)
print(env.observation_space.low)

count = 0
for t in range(100):
    #随机选择一个动作
    action = env.action_space.sample()
    #执行动作 获取环境反馈
    observation, reward, done, info = env.step(action)
    #如果玩死了就退出
    if done:
        break
    env.render()
    count+=1
    time.sleep(0.2)
print(count)

 

效果图:

技术分享图片

以上是关于gym强化学习入门demo——随机选取动作 其实有了这些动作和反馈值以后就可以用来训练DNN网络了的主要内容,如果未能解决你的问题,请参考以下文章

强化学习笔记:Gym入门--从安装到第一个完整的代码示例

强化学习7日打卡营--使用gym游戏的预处理

Gym迎来首个完整环境文档,强化学习入门更加简单!

强化学习——入门

强化学习 平台 openAI 的 gym 安装 (Ubuntu环境下如何安装Python的gym模块)

强化学习—— 离散与连续动作空间(随机策略梯度与确定策略梯度)