torch.argmax与torch.max详解

Posted NorthSmile

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了torch.argmax与torch.max详解相关的知识,希望对你有一定的参考价值。

Pytorch常用函数

一、torch.max

1.调用方式

1)torch.max(input):只需送入输入张量;

2)torch.max(input, dim, keepdim=False, *, out=None):送入张量的同时,需要指定沿着哪个维度进行最大值运算;
这两种调用方式对输入张量的形状没有要求,一维数据或者多维数据都可以。

2.相关介绍

1)返回输入张量中最大值相关数据:

  • 方式一,即不指定dim时,默认将张量展开成一维张量,然后返回第一个最大值;
  • 方式二,即指定dim时,沿着指定的dim维进行最大值运算,输出结果由剩下的维度组成,比如原始维度为H,W,若指定dim=0(即H维),则输出结果由W个元素构成;

2)如果有多个最大值则返回第一个最大值;

3.代码实例及图示理解

首先定义一个简单的方法,当传入张量x和维度dim参数时,分别打印两种调用方式对应的输出:

def print_maxvalue(x,dim=0):
    max_value=torch.max(x)
    print(max_value)
    print('-'*10)
    max_value,max_index=torch.max(x,dim=dim)
    print(max_value)
    print(max_index)

对于二维数据,其形状为(H,W)=(10,2):

x=torch.tensor([[0, 1],
        [2, 5],
        [7, 3],
        [5, 1],
        [8, 7],
        [7, 6],
        [9, 6],
        [4, 4],
        [2, 0],
        [9, 9]])
print_maxvalue(x,dim=0)

输出结果:

tensor(9)  # 所有元素中的第一个最大值
----------
tensor([9, 9])  # 沿着指定dim维进行最大值运算
tensor([6, 9])  # 沿着指定dim维进行最大值运算,并返回最大值对应的下标

结果分析:
(1)方式一
将张量展开成一维张量,其长度为L=10×2=20,然后返回第一个最大值9

(2)方式二
指定dim=0,此维度长度为10,表示沿着第0维进行最大值运算,分别对第0维的10个元素取最大值,并返回其对应下标

二、torch.argmax

1.调用方式

1)torch.argmax(input):只需送入输入张量;

2)torch.argmax(input, dim, keepdim=False):送入张量的同时,需要指定沿着哪个维度进行运算;
这两种调用方式对输入张量的形状没有要求,一维数据或者多维数据都可以。

2.相关介绍

1)返回输入张量中最大值的索引:

  • 方式一,即不指定dim时,默认将张量展开成一维张量,然后返回对应的下标;
  • 方式二,即指定dim时,沿着指定的dim维进行选择,输出结果由剩下的维度组成,比如原始维度为H,W,若指定dim=0(即H维),则输出结果由W个元素构成;

2)如果有多个最大值则返回第一个最大值的下标;
3)返回torch.max函数指定dim时返回的第二个值;

3.代码实例及图示理解

首先定义一个简单的方法,当传入张量x和维度dim参数时,分别打印两种调用方式对应的输出:

def print_(x,dim=0):
    # print(x)
    # print(x.shape)
    print('-' * 10)
    # 方式一
    max_index = torch.argmax(x)
    print(max_index)
    print('-' * 10)
    # 方式二
    max_index = torch.argmax(x, dim=dim)
    print(max_index)
    print('-' * 10)

1)一维数据:L

x=torch.tensor([8, 2, 7, 15, 1])
print_(x,dim=0)

输出结果:

tensor(3)
tensor(3)

结果分析:

这是最简单的一种方式,就类似一维数组查询最大元素对应下标的过程一致:

  • 对于方式一,传入一维张量后,直接返回第一个最大值15对应的下标3;
  • 对于方式二, 此时数据只有一个维度,故只能指定沿着维度dim=0进行运算,实质还是在所有元素中寻找最大值并返回其下标;

2)二维数据:(H,W)

x=torch.tensor([
		[0, 1],
        [2, 5],
        [7, 3],
        [5, 1],
        [8, 7],
        [7, 6],
        [9, 6],
        [4, 4],
        [2, 0],
        [9, 9]])
print_(x,dim=0)
# print_(x,dim=1)

输出结果:

dim=0:H,W->W
tensor(12)
tensor([6, 9]) 

# 一般分类问题就适用这种情况,在一个批次的预测输出中确定每个样本的类别,输出结果中每个元素即表示批次中每个样本对应的类别
dim=1: H,W->H
tensor(12)
tensor([1, 1, 0, 0, 0, 0, 0, 0, 0, 0])

结果分析:
(1)方式一
先将输入张量沿着所有维度展开为一维数据,然后返回第一个最大值9对应的下标12

(2)方式二
函数沿着指定的dim维度进行运算,
dim=0表示张量沿着第0维的方向进行运算,比如此处dim=0维长度为10,则表示在每列的10个元素中找到最大值并返回其下标:
此处第一列最大值为9,而其下标为6

dim=1表示张量沿着第1维的方向进行运算,比如此处dim=1维长度为2,则表示在每行的2个元素中找到最大值并返回其下标:
此处第一行最大值为1,而其下标为1

3)多维数据:(N,C,H,W)

x=torch.tensor([[
          [[1, 3],
          [7, 8]],

         [[8, 1],
          [5, 3]],

         [[2, 8],
          [4, 4]]],


        [[[3, 0],
          [2, 0]],

         [[0, 4],
          [7, 16]],

         [[4, 8],
          [4, 3]]]])

print_(x,dim=0)
# print_(x,dim=1)
# print_(x,dim=2)
# print_(x,dim=3)

输出结果:

dim=0:N,C,H,W->C,H,W
tensor(19)
tensor([[[1, 0],
         [0, 0]],

        [[0, 1],
         [1, 1]],

        [[1, 0],
         [0, 0]]])

dim=1:N,C,H,W->N,H,W
tensor(19)
tensor([[[1, 2],
         [0, 0]],

        [[2, 2],
         [1, 1]]])

dim=2:N,C,H,W->N,C,W
tensor(19)
tensor([[[1, 1],
         [0, 1],
         [1, 0]],

        [[0, 0],
         [1, 1],
         [0, 0]]])

dim=3:N,C,H,W->N,C,H
tensor(19)
tensor([[[1, 1],
         [0, 0],
         [1, 0]],

        [[0, 0],
         [1, 1],
         [1, 0]]])

结果分析:
开始就说到了,

  • 当调用方式二,指定dim时,函数会沿着指定的维度进行运算,其输出结果的维度由剩余的维度决定;
  • 使用方式一时会直接将张量展开为一维数据,然后返回第一个最大值的下标;

(1)方式一
输入张量形状为(N,C,H,W)=(2,3,2,2),可以清晰地看到,将张量展开为一维数据为长度为L=2×3×2×2=24,且第一个最大值16此时对应的下标为19。

(2)方式二
dim=0维长度为2,剩余维度为(3,2,2)

dim=1维长度为3,剩余维度为(2,2,2)

依次类推…

总结:
其实该函数应用场景最多的是分类任务在进行测试时,判断预测结果的对应类别,此时函数的输入通常为二维数据,只需要使用torch.argmax(x,dim=1)即可达到想要的结果。

三、torch.max与torch.argmax的联系

1)torch.max在寻找输入张量中最大值,而torch.argmax则是寻找最大值对应的下标;
2)二者均使用第一种方式,即未指定dim时,直接将张量展开为一维数据,torch.max返回第一个最大值本身,而torch.argmax则返回最大值的下标;
3)二者均使用第二种方式,即指定dim时,torch.max沿着指定的dim维选取最大值,同时返回最大值本身及其对应下标,而torch.argmax只返回最大值对应的下标。换句话说,torch.argmax的输出结果其实是torch.max指定dim时返回结果中的第二个元素,对应最大值的下标索引;

举个例子:
对于输入张量:

x=torch.tensor([[0, 1],
        [2, 5],
        [7, 3],
        [5, 1],
        [8, 7],
        [7, 6],
        [9, 6],
        [4, 4],
        [2, 0],
        [9, 9]])

torch.argmax(x,dim=0)的输出结果为:

tensor([6, 9]) 

torch.max(x,dim=0)的输出结果为:

torch.return_types.max(values=tensor([9, 9]),indices=tensor([6, 9]))

其中indices即表示指定dim时找到的最大值的对应下标。

以上是关于torch.argmax与torch.max详解的主要内容,如果未能解决你的问题,请参考以下文章

搞懂PyTorchtorch.argmax() 函数详解

Pytorch:解释 torch.argmax

torch.argmax和argmin返回值

PyTorch中的torch.max()和torch.maximum()的用法详解

当想要找到具有最高 `start` 分数的标记时,torch.argmax() 中的 TypeError

小白学习之pytorch框架-softmax回归(torch.gather()torch.argmax())