在 pytorch 中为 CNN 设置自定义内核

Posted

技术标签:

【中文标题】在 pytorch 中为 CNN 设置自定义内核【英文标题】:Setting custom kernel for CNN in pytorch 【发布时间】:2019-03-18 08:22:40 【问题描述】:

有没有办法在 pytorch 中为卷积神经网络指定我们自己的自定义内核值?张量流中的kernel_initialiser 之类的东西?例如。我想要一个 nn.Conv2d 中的 3x3 内核并进行初始化,以便它充当身份内核 -

0 0 00 1 00 0 0

(这将有效地返回与我在第一次迭代中的输入相同的输出)

我对该主题的非详尽研究 -

我可以使用nn.init,但它只有一些预定义的内核初始化值。

我尝试关注他们在official thread 上的讨论,但这不符合我的需求。

我的研究中可能遗漏了一些东西,请随时指出。

【问题讨论】:

【参考方案1】:

感谢ptrblck 我能够解决它。 我可以将一个新的卷积层定义为conv,根据示例,我可以使用 -

weights = ch.Tensor([[0, 0, 0], [0, 1, 0], [0, 0, 0]]).unsqueeze(0).unsqueeze(0)
weights.requires_grad = True


conv = nn.Conv2d(1, 1, kernel_size=3, stride=1, padding=1, bias=False)

with ch.no_grad():
    conv.weight = nn.Parameter(weights)

然后我可以继续使用conv 作为我的常规nn.Conv2d 层。

【讨论】:

【参考方案2】:

我认为更简单的解决方案是:

    deconv = nn.ConvTranspose2d(
        in_channels=channel_dim, out_channels=channel_dim,
        kernel_size=kernel_size, stride=stride,
        bias=False, padding=1, output_padding=1
    )
    deconv.weight.data.copy_(
        get_upsampling_weight(channel_dim, channel_dim, kernel_size)
    )

换句话说就是使用copy_

【讨论】:

以上是关于在 pytorch 中为 CNN 设置自定义内核的主要内容,如果未能解决你的问题,请参考以下文章

在 R 中为 svm 编写自定义内核

在 CNN 的 keras 自定义损失函数中操作数据

Keras CIFAR-10分类 自定义simple CNN篇

如何在 iOS 中为自定义属性设置动画

如何在 CodeIgniter 中为 403 禁止错误设置自定义页面

在 UITableViewCell 中为自定义 UIButton 设置动画