在 Pytorch 中嵌入 3D 数据

Posted

技术标签:

【中文标题】在 Pytorch 中嵌入 3D 数据【英文标题】:Embedding 3D data in Pytorch 【发布时间】:2018-04-22 16:16:34 【问题描述】:

我想实现字符级嵌入。

这是通常的词嵌入。

词嵌入

Input: [ [‘who’, ‘is’, ‘this’] ] 
-> [ [3, 8, 2] ]     # (batch_size, sentence_len)
-> // Embedding(Input)
 # (batch_size, seq_len, embedding_dim)

这就是我想做的。

字符嵌入

Input: [ [ [‘w’, ‘h’, ‘o’, 0], [‘i’, ‘s’, 0, 0], [‘t’, ‘h’, ‘i’, ‘s’] ] ]
-> [ [ [2, 3, 9, 0], [ 11, 4, 0, 0], [21, 10, 8, 9] ] ]      # (batch_size, sentence_len, word_len)
-> // Embedding(Input) # (batch_size, sentence_len, word_len, embedding_dim)
-> // sum each character embeddings  # (batch_size, sentence_len, embedding_dim)
The final output shape is same as Word embedding. Because I want to concat them later.

虽然我试过了,但我不确定如何实现 3-D 嵌入。你知道如何实现这样的数据吗?

def forward(self, x):
    print('x', x.size()) # (N, seq_len, word_len)
    bs = x.size(0)
    seq_len = x.size(1)
    word_len = x.size(2)
    embd_list = []
    for i, elm in enumerate(x):
        tmp = torch.zeros(1, word_len, self.embd_size)
        for chars in elm:
            tmp = torch.add(tmp, 1.0, self.embedding(chars.unsqueeze(0)))

上面的代码出错了,因为self.embedding 的输出是Variable

TypeError: torch.add received an invalid combination of arguments - got (torch.FloatTensor, float, Variable), but expected one of:
 * (torch.FloatTensor source, float value)
 * (torch.FloatTensor source, torch.FloatTensor other)
 * (torch.FloatTensor source, torch.SparseFloatTensor other)
 * (torch.FloatTensor source, float value, torch.FloatTensor other)
      didn't match because some of the arguments have invalid types: (torch.FloatTensor, float, Variable)
 * (torch.FloatTensor source, float value, torch.SparseFloatTensor other)
      didn't match because some of the arguments have invalid types: (torch.FloatTensor, float, Variable)

更新

我可以做到这一点。但是for 对批处理无效。你们知道更有效的方法吗?

def forward(self, x):
    print('x', x.size()) # (N, seq_len, word_len)
    bs = x.size(0)
    seq_len = x.size(1)
    word_len = x.size(2)
    embd = Variable(torch.zeros(bs, seq_len, self.embd_size))
    for i, elm in enumerate(x): # every sample
        for j, chars in enumerate(elm): # every sentence. [ [‘w’, ‘h’, ‘o’, 0], [‘i’, ‘s’, 0, 0], [‘t’, ‘h’, ‘i’, ‘s’] ]
            chars_embd = self.embedding(chars.unsqueeze(0)) # (N, word_len, embd_size) [‘w’,‘h’,‘o’,0]
            chars_embd = torch.sum(chars_embd, 1) # (N, embd_size). sum each char's embedding
            embd[i,j] = chars_embd[0] # set char_embd as word-like embedding

    x = embd # (N, seq_len, embd_dim)

更新2

这是我的最终代码。谢谢你,瓦西·艾哈迈德!

def forward(self, x):
    # x: (N, seq_len, word_len)
    input_shape = x.size()
    bs = x.size(0)
    seq_len = x.size(1)
    word_len = x.size(2)
    x = x.view(-1, word_len) # (N*seq_len, word_len)
    x = self.embedding(x) # (N*seq_len, word_len, embd_size)
    x = x.view(*input_shape, -1) # (N, seq_len, word_len, embd_size)
    x = x.sum(2) # (N, seq_len, embd_size)

    return x

【问题讨论】:

我认为您应该将 tmp 包装为变量。 tmp = 变量(tmp)。让我知道这是否有效。 @Steven 谢谢。我更新了。但仍然需要有效的方法 嗨,愚蠢的问题,但输入数据中的数字来自哪里? ([ [ [2, 3, 9, 0], [ 11, 4, 0, 0], [21, 10, 8, 9] ] ]) 【参考方案1】:

我假设你有一个形状为BxSxW 的 3d 张量,其中:

B = Batch size
S = Sentence length
W = Word length

你已经声明了嵌入层如下。

self.embedding = nn.Embedding(dict_size, emsize)

地点:

dict_size = No. of unique characters in the training corpus
emsize = Expected size of embeddings

所以,现在您需要将形状为 BxSxW 的 3d 张量转换为形状为 BSxW 的 2d 张量,并将其提供给嵌入层。

emb = self.embedding(input_rep.view(-1, input_rep.size(2)))

emb 的形状将是BSxWxE,其中E 是嵌入大小。您可以将生成的 3d 张量转换为 4d 张量,如下所示。

emb = emb.view(*input_rep.size(), -1)

emb 的最终形状将是 BxSxWxE,这是您所期望的。

【讨论】:

你是我的超级英雄!这是一个非常好的和有用的技巧。我更新了我的帖子。非常感谢。

以上是关于在 Pytorch 中嵌入 3D 数据的主要内容,如果未能解决你的问题,请参考以下文章

双目立体视觉PyTorch & ZED 3D人体识别与追踪 (上)

双目立体视觉PyTorch & ZED 3D人体识别与追踪 (下)

双目立体视觉PyTorch & ZED 3D人体识别与追踪 (上)

双目立体视觉PyTorch & ZED 3D人体识别与追踪 (下)

pytorch:“不支持多目标”错误消息

PyTorch学习----01