Pytorch中的强化学习

Posted sbj123456789

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pytorch中的强化学习相关的知识,希望对你有一定的参考价值。

torch.distributions.Categorical()

功能:根据概率分布来产生sample,产生的sample是输入tensor的index
如:
  >>> m = Categorical(torch.tensor([ 0.25, 0.25, 0.25, 0.25 ]))
  >>> m.sample()   # equal probability of 0, 1, 2, 3
  tensor(3)
 

以上是关于Pytorch中的强化学习的主要内容,如果未能解决你的问题,请参考以下文章

深度强化学习 DQN 模型解析,附Pytorch完整代码

代码集合深度强化学习Pytorch实现集锦

Pytorch中的强化学习

如何使用 PyTorch DataLoader 进行强化学习?

PyTorch强化学习实战——强化学习环境配置与PyTorch基础

深度强化学习 Policy Gradients 模型解析,附Pytorch完整代码