torch.argmax与torch.max详解
Posted NorthSmile
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了torch.argmax与torch.max详解相关的知识,希望对你有一定的参考价值。
Pytorch常用函数
一、torch.max
1.调用方式
1)torch.max(input)
:只需送入输入张量;
或
2)torch.max(input, dim, keepdim=False, *, out=None)
:送入张量的同时,需要指定沿着哪个维度进行最大值运算;
这两种调用方式对输入张量的形状没有要求,一维数据或者多维数据都可以。
2.相关介绍
1)返回输入张量中最大值相关数据:
- 方式一,即不指定dim时,默认将张量展开成一维张量,然后返回第一个最大值;
- 方式二,即指定dim时,沿着指定的dim维进行最大值运算,输出结果由剩下的维度组成,比如原始维度为H,W,若指定dim=0(即H维),则输出结果由W个元素构成;
2)如果有多个最大值则返回第一个最大值;
3.代码实例及图示理解
首先定义一个简单的方法,当传入张量x和维度dim参数时,分别打印两种调用方式对应的输出:
def print_maxvalue(x,dim=0):
max_value=torch.max(x)
print(max_value)
print('-'*10)
max_value,max_index=torch.max(x,dim=dim)
print(max_value)
print(max_index)
对于二维数据,其形状为(H,W)=(10,2):
x=torch.tensor([[0, 1],
[2, 5],
[7, 3],
[5, 1],
[8, 7],
[7, 6],
[9, 6],
[4, 4],
[2, 0],
[9, 9]])
print_maxvalue(x,dim=0)
输出结果:
tensor(9) # 所有元素中的第一个最大值
----------
tensor([9, 9]) # 沿着指定dim维进行最大值运算
tensor([6, 9]) # 沿着指定dim维进行最大值运算,并返回最大值对应的下标
结果分析:
(1)方式一
将张量展开成一维张量,其长度为L=10×2=20,然后返回第一个最大值9
(2)方式二
指定dim=0,此维度长度为10,表示沿着第0维进行最大值运算,分别对第0维的10个元素取最大值,并返回其对应下标
二、torch.argmax
1.调用方式
1)torch.argmax(input)
:只需送入输入张量;
或
2)torch.argmax(input, dim, keepdim=False)
:送入张量的同时,需要指定沿着哪个维度进行运算;
这两种调用方式对输入张量的形状没有要求,一维数据或者多维数据都可以。
2.相关介绍
1)返回输入张量中最大值的索引:
- 方式一,即不指定dim时,默认将张量展开成一维张量,然后返回对应的下标;
- 方式二,即指定dim时,沿着指定的dim维进行选择,输出结果由剩下的维度组成,比如原始维度为H,W,若指定dim=0(即H维),则输出结果由W个元素构成;
2)如果有多个最大值则返回第一个最大值的下标;
3)返回torch.max函数指定dim时返回的第二个值;
3.代码实例及图示理解
首先定义一个简单的方法,当传入张量x和维度dim参数时,分别打印两种调用方式对应的输出:
def print_(x,dim=0):
# print(x)
# print(x.shape)
print('-' * 10)
# 方式一
max_index = torch.argmax(x)
print(max_index)
print('-' * 10)
# 方式二
max_index = torch.argmax(x, dim=dim)
print(max_index)
print('-' * 10)
1)一维数据:L
x=torch.tensor([8, 2, 7, 15, 1])
print_(x,dim=0)
输出结果:
tensor(3)
tensor(3)
结果分析:
这是最简单的一种方式,就类似一维数组查询最大元素对应下标的过程一致:
- 对于方式一,传入一维张量后,直接返回第一个最大值15对应的下标3;
- 对于方式二, 此时数据只有一个维度,故只能指定沿着维度dim=0进行运算,实质还是在所有元素中寻找最大值并返回其下标;
2)二维数据:(H,W)
x=torch.tensor([
[0, 1],
[2, 5],
[7, 3],
[5, 1],
[8, 7],
[7, 6],
[9, 6],
[4, 4],
[2, 0],
[9, 9]])
print_(x,dim=0)
# print_(x,dim=1)
输出结果:
dim=0:H,W->W
tensor(12)
tensor([6, 9])
# 一般分类问题就适用这种情况,在一个批次的预测输出中确定每个样本的类别,输出结果中每个元素即表示批次中每个样本对应的类别
dim=1: H,W->H
tensor(12)
tensor([1, 1, 0, 0, 0, 0, 0, 0, 0, 0])
结果分析:
(1)方式一
先将输入张量沿着所有维度展开为一维数据,然后返回第一个最大值9对应的下标12
(2)方式二
函数沿着指定的dim维度进行运算,
dim=0表示张量沿着第0维的方向进行运算,比如此处dim=0维长度为10,则表示在每列的10个元素中找到最大值并返回其下标:
此处第一列最大值为9,而其下标为6
dim=1表示张量沿着第1维的方向进行运算,比如此处dim=1维长度为2,则表示在每行的2个元素中找到最大值并返回其下标:
此处第一行最大值为1,而其下标为1
3)多维数据:(N,C,H,W)
x=torch.tensor([[
[[1, 3],
[7, 8]],
[[8, 1],
[5, 3]],
[[2, 8],
[4, 4]]],
[[[3, 0],
[2, 0]],
[[0, 4],
[7, 16]],
[[4, 8],
[4, 3]]]])
print_(x,dim=0)
# print_(x,dim=1)
# print_(x,dim=2)
# print_(x,dim=3)
输出结果:
dim=0:N,C,H,W->C,H,W
tensor(19)
tensor([[[1, 0],
[0, 0]],
[[0, 1],
[1, 1]],
[[1, 0],
[0, 0]]])
dim=1:N,C,H,W->N,H,W
tensor(19)
tensor([[[1, 2],
[0, 0]],
[[2, 2],
[1, 1]]])
dim=2:N,C,H,W->N,C,W
tensor(19)
tensor([[[1, 1],
[0, 1],
[1, 0]],
[[0, 0],
[1, 1],
[0, 0]]])
dim=3:N,C,H,W->N,C,H
tensor(19)
tensor([[[1, 1],
[0, 0],
[1, 0]],
[[0, 0],
[1, 1],
[1, 0]]])
结果分析:
开始就说到了,
- 当调用方式二,指定dim时,函数会沿着指定的维度进行运算,其输出结果的维度由剩余的维度决定;
- 使用方式一时会直接将张量展开为一维数据,然后返回第一个最大值的下标;
(1)方式一
输入张量形状为(N,C,H,W)=(2,3,2,2),可以清晰地看到,将张量展开为一维数据为长度为L=2×3×2×2=24,且第一个最大值16此时对应的下标为19。
(2)方式二
dim=0维长度为2,剩余维度为(3,2,2)
dim=1维长度为3,剩余维度为(2,2,2)
依次类推…
总结:
其实该函数应用场景最多的是分类任务在进行测试时,判断预测结果的对应类别,此时函数的输入通常为二维数据,只需要使用torch.argmax(x,dim=1)即可达到想要的结果。
三、torch.max与torch.argmax的联系
1)torch.max在寻找输入张量中最大值,而torch.argmax则是寻找最大值对应的下标;
2)二者均使用第一种方式,即未指定dim时,直接将张量展开为一维数据,torch.max返回第一个最大值本身,而torch.argmax则返回最大值的下标;
3)二者均使用第二种方式,即指定dim时,torch.max沿着指定的dim维选取最大值,同时返回最大值本身及其对应下标,而torch.argmax只返回最大值对应的下标。换句话说,torch.argmax的输出结果其实是torch.max指定dim时返回结果中的第二个元素,对应最大值的下标索引;
举个例子:
对于输入张量:
x=torch.tensor([[0, 1],
[2, 5],
[7, 3],
[5, 1],
[8, 7],
[7, 6],
[9, 6],
[4, 4],
[2, 0],
[9, 9]])
torch.argmax(x,dim=0)的输出结果为:
tensor([6, 9])
torch.max(x,dim=0)的输出结果为:
torch.return_types.max(values=tensor([9, 9]),indices=tensor([6, 9]))
其中indices即表示指定dim时找到的最大值的对应下标。
以上是关于torch.argmax与torch.max详解的主要内容,如果未能解决你的问题,请参考以下文章
PyTorch中的torch.max()和torch.maximum()的用法详解