AWS DeepRacer 强化学习RL,工作流程

Posted 架构师易筋

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了AWS DeepRacer 强化学习RL,工作流程相关的知识,希望对你有一定的参考价值。

1. 强化学习RL - Reinforcement learning

通过强化学习,模型通过对采取的每个行为进行奖励和惩罚这样持续的过程来学习。就是奖励积极行动,惩罚消极行动。
监督学习

非监督学习

强化学习









2. AWS DeepRacer 工作流程

无论您最终是在虚拟赛道上还是实际赛道上比赛,都希望在模拟环境中开始 – 构建、训练、评估和重复这个过程,直到您对模型进行足够的优化,认为该模型已准备好参加竞赛。然后,如果您愿意,可以将其部署到实体车上。


这一切都从在 Amazon DeepRacer 控制台中创建模型开始。您可以使用控制台进行模型配置。构建完成后,使用模拟器来训练然后评估模型。模拟器是个很棒的工具:您可以实时查看模型如何响应您所选择的设置。

您训练模型后,可以在模拟器中评估模型的性能,了解每次运行完成单圈赛道的百分比以及完成每次运行所需的总时间。

如果您对经过训练和评估的模型满意,可以克隆该模型并开始调整配置以提高性能。

一旦模型的表现能够满足您的期望,可将其部署到赛车上并开始在实际赛道上赛车,或者在虚拟赛事使用您的模型竞赛。

参考

https://www.aws.training/Details/eLearning?id=75478

以上是关于AWS DeepRacer 强化学习RL,工作流程的主要内容,如果未能解决你的问题,请参考以下文章

基础的强化学习(RL)算法及代码详细demo

为啥 RL 被称为“强化”学习?

Easy RL:强化学习教程:什么是强化学习

轻松入门强化学习的一本新书《Easy RL 强化学习教程》

DeepRacer 资源合集

深度强化学习(Deep Reinforcement Learning)入门:RL base & DQN-DDPG-A3C introduction