PyTorch 对类别张量进行 one-hot 编码

Posted 麦克斯的园丁

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了PyTorch 对类别张量进行 one-hot 编码相关的知识,希望对你有一定的参考价值。

参考:

-TORCH.INDEX_SELECT
-PyTorch 对类别张量进行 one-hot 编码

正文


index_select
torch.index_select(input, dim, index, *, out=None) → Tensor

- input (Tensor) – the input tensor.
- dim (int) – the dimension in which we index
- index (IntTensor or LongTensor) – the 1-D tensor containing the indices to index

该函数如其名,就是用索引来选择 tensor 的指定维度的子 tensor 的。

想要理解这一方法的动机,实际上需要反过来,从类别标签的角度看待one-hot编码。

对于原始从小到大排布的类别序号对应的one-hot编码成的矩阵就是一个单位矩阵。所以每个类别对应的就是该单位矩阵的特定的列(或者行)。这一需求恰好符合index_select的功能。所以我们可以使用其实现one_hot编码,只需要使用类别序号索引特定的列或者行即可。下面就是一个例子:

def bhw_to_onehot_by_index_select(bhw_tensor: torch.Tensor, num_classes: int):
    """
    Args:
        bhw_tensor: b,h,w
        num_classes:
    Returns: b,h,w,num_classes
    """
    assert bhw_tensor.ndim == 3, bhw_tensor.shape
    assert num_classes > bhw_tensor.max(), torch.unique(bhw_tensor)
    one_hot = torch.eye(num_classes).index_select(dim=0, index=bhw_tensor.reshape(-1))
    one_hot = one_hot.reshape(*bhw_tensor.shape, num_classes)
    return one_hot

以上是关于PyTorch 对类别张量进行 one-hot 编码的主要内容,如果未能解决你的问题,请参考以下文章

当目标不是单热时,如何计算 Pytorch 中 2 个张量之间的正确交叉熵?

Pytorch张量操作

Pytorch基本使用(2)Tensor转成one-hot形式

PyTorch——Tensor_把索引标签转换成one-hot标签表示

one-hot编码(pytorch实现)

类别的one-hot编码