Horizon:Facebook的应用强化学习平台(PyTorch/Caffe2)

Posted 专知

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Horizon:Facebook的应用强化学习平台(PyTorch/Caffe2)相关的知识,希望对你有一定的参考价值。

【导读】近期,Facebook开源了强化学习平台Horizon,Horizon是用Python构建的,使用PyTorch进行建模和训练,使用Caffe2进行模型服务。 


Horizon是一个端到端平台,旨在解决行业应用的RL问题。强化学习在其数据集很大(数百万到数十亿),反馈环路很慢(相对于模拟器)时,必须小心地进行实验,因为它们不在模拟器中运行。 与其他通常用于快速原型设计和实验的RL平台不同,Horizon的设计以生产用例为首要考虑因素。 该平台包含用于训练流行的深度RL算法的工作流程,包括数据预处理,特征转换,分布式训练,反事实策略评估和优化服务。 


支持的算法:

  • Discrete-Action DQN

  • Parametric-Action DQ

  • Double DQNDueling DQNDueling Double DQN

  • DDPG

  • [Soft Actor-Critic]

    (https://arxiv.org/abs/1801.01290) (SAC)

https://github.com/facebookresearch/Horizon


https://research.fb.com/publications/horizon-facebooks-open-source-applied-reinforcement-learning-platform/


-END-

专 · 知


人工智能领域26个主题知识资料全集获取与加入专知人工智能服务群: 欢迎微信扫一扫加入专知人工智能知识星球群,获取专业知识教程视频资料和与专家交流咨询!

Horizon:Facebook的应用强化学习平台(PyTorch/Caffe2)


请PC登录www.zhuanzhi.ai或者点击阅读原文,注册登录专知,获取更多AI知识资料!


请加专知小助手微信(扫一扫如下二维码添加),加入专知主题群(请备注主题类型:AI、NLP、CV、 KG等)交流~

 AI 项目技术 & 商务合作:bd@zhuanzhi.ai, 或扫描上面二维码联系!

点击“阅读原文”,使用专知


以上是关于Horizon:Facebook的应用强化学习平台(PyTorch/Caffe2)的主要内容,如果未能解决你的问题,请参考以下文章

NVIDIA与Facebook携手强化Caffe2深度学习框架

强化学习 常用平台

强化学习 平台 openAI 的 gym 安装 (Ubuntu环境下如何安装Python的gym模块)

深度强化学习 如何训练

在线广告推荐系统中的深度强化学习

描述vmwarehorizonview桌面虚拟化的特性有哪几方面