torch.max(action_value, 1)[1].data.numpy()[0] 是什么意思

Posted 软件工程小施同学

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了torch.max(action_value, 1)[1].data.numpy()[0] 是什么意思相关的知识,希望对你有一定的参考价值。

torch.max(action_value, 1)表示取action_value里每行的最大值

torch.max(action_value, 1)[1]表示最大值对应的下标

.data.numpy()[0]表示将将Variable转换成tensor

action_value = self.eval_net.forward(x)


action = torch.max(action_value, 1)[1].data.numpy()[0]


print("<choose_action> action_value=", action_value, "torch.max(action_value, 1)=",torch.max(action_value, 1),"torch.max(action_value, 1)[1]=",torch.max(action_value, 1)[1], "action=", action)


 <choose_action> action_value= tensor([[-0.2394, -0.3109, -0.3330, -0.0376]], grad_fn=<AddmmBackward0>) torch.max(action_value, 1)= torch.return_types.max(
values=tensor([-0.0376], grad_fn=<MaxBackward0>),
indices=tensor([3])) torch.max(action_value, 1)[1]= tensor([3]) action= 3

参考:torch.max() - 知乎a0 = torch.max(a, dim) 其中a为一个tensor dim的值为 0/1,分别代表索引每列/行最大值返回的值包含两个数据(values, indices) 分别代表最大值的值和所在的索引 一般我们只需要里面的索引,而对最大值的值不感兴…https://zhuanlan.zhihu.com/p/468861622

以上是关于torch.max(action_value, 1)[1].data.numpy()[0] 是什么意思的主要内容,如果未能解决你的问题,请参考以下文章

torch.max()函数predic = torch.max(outputs.data, 1)[1].cpu().numpy()

torch.argmax与torch.max详解

PyTorch中的torch.max()和torch.maximum()的用法详解

pytorch max和clamp

关于 decoder_outputs[:,t,:] = decoder_output_t torch.topk, torch.max(),torch.argmax()的演示

从图像角度理解torch.mean()函数。继而学习torch.max等等相关函数