PyTorch 中 tensor.permute 和 tensor.view 的区别?
Posted
技术标签:
【中文标题】PyTorch 中 tensor.permute 和 tensor.view 的区别?【英文标题】:Difference between tensor.permute and tensor.view in PyTorch? 【发布时间】:2018-12-11 02:19:18 【问题描述】:tensor.permute()
和 tensor.view()
有什么区别?
他们似乎做同样的事情。
【问题讨论】:
【参考方案1】:link 对视图、重塑和置换给出了清晰的解释:
view
适用于连续张量。
reshape
适用于非连续张量。
permute
返回原始张量输入的视图,其尺寸已置换。它与view
和reshape
完全不同。
【讨论】:
【参考方案2】:tensor.permute()
置换张量轴的顺序。
tensor.view()
通过减小/扩展每个维度的大小来重塑张量(类似于numpy.reshape
)(如果一个维度增加,其他维度必须减小)。
【讨论】:
【参考方案3】:输入
In [12]: aten = torch.tensor([[1, 2, 3], [4, 5, 6]])
In [13]: aten
Out[13]:
tensor([[ 1, 2, 3],
[ 4, 5, 6]])
In [14]: aten.shape
Out[14]: torch.Size([2, 3])
torch.view()
将张量重塑为不同但兼容的形状。例如,我们的输入张量aten
的形状为(2, 3)
。这可以查看为形状的张量(6, 1)
、(1, 6)
等,
# reshaping (or viewing) 2x3 matrix as a column vector of shape 6x1
In [15]: aten.view(6, -1)
Out[15]:
tensor([[ 1],
[ 2],
[ 3],
[ 4],
[ 5],
[ 6]])
In [16]: aten.view(6, -1).shape
Out[16]: torch.Size([6, 1])
或者,也可以将其重新整形或查看为形状为(1, 6)
的行向量,如下所示:
In [19]: aten.view(-1, 6)
Out[19]: tensor([[ 1, 2, 3, 4, 5, 6]])
In [20]: aten.view(-1, 6).shape
Out[20]: torch.Size([1, 6])
而tensor.permute()
仅用于交换轴。下面的例子会让事情变得清楚:
In [39]: aten
Out[39]:
tensor([[ 1, 2, 3],
[ 4, 5, 6]])
In [40]: aten.shape
Out[40]: torch.Size([2, 3])
# swapping the axes/dimensions 0 and 1
In [41]: aten.permute(1, 0)
Out[41]:
tensor([[ 1, 4],
[ 2, 5],
[ 3, 6]])
# since we permute the axes/dims, the shape changed from (2, 3) => (3, 2)
In [42]: aten.permute(1, 0).shape
Out[42]: torch.Size([3, 2])
你也可以使用负索引来做同样的事情:
In [45]: aten.permute(-1, 0)
Out[45]:
tensor([[ 1, 4],
[ 2, 5],
[ 3, 6]])
In [46]: aten.permute(-1, 0).shape
Out[46]: torch.Size([3, 2])
【讨论】:
【参考方案4】:View 改变了张量的表示方式。例如:具有 4 个元素的张量可以表示为 4X1 或 2X2 或 1X4,但 permute 会改变轴。置换数据时移动但视图数据不会移动而只是重新解释。
以下代码示例可能会对您有所帮助。 a
是 2x2 张量/矩阵。通过使用视图,您可以将a
读取为列或行向量(张量)。但是你不能转置它。要转置,您需要置换。转置是通过交换/置换轴来实现的。
In [7]: import torch
In [8]: a = torch.tensor([[1,2],[3,4]])
In [9]: a
Out[9]:
tensor([[ 1, 2],
[ 3, 4]])
In [11]: a.permute(1,0)
Out[11]:
tensor([[ 1, 3],
[ 2, 4]])
In [12]: a.view(4,1)
Out[12]:
tensor([[ 1],
[ 2],
[ 3],
[ 4]])
In [13]:
奖励:见https://twitter.com/karpathy/status/1013322763790999552
【讨论】:
以上是关于PyTorch 中 tensor.permute 和 tensor.view 的区别?的主要内容,如果未能解决你的问题,请参考以下文章