在 pytorch 中为 CNN 设置自定义内核
Posted
技术标签:
【中文标题】在 pytorch 中为 CNN 设置自定义内核【英文标题】:Setting custom kernel for CNN in pytorch 【发布时间】:2019-03-18 08:22:40 【问题描述】:有没有办法在 pytorch 中为卷积神经网络指定我们自己的自定义内核值?张量流中的kernel_initialiser 之类的东西?例如。我想要一个 nn.Conv2d
中的 3x3 内核并进行初始化,以便它充当身份内核 -
0 0 0
0 1 0
0 0 0
(这将有效地返回与我在第一次迭代中的输入相同的输出)
我对该主题的非详尽研究 -
我可以使用nn.init,但它只有一些预定义的内核初始化值。
我尝试关注他们在official thread 上的讨论,但这不符合我的需求。
我的研究中可能遗漏了一些东西,请随时指出。
【问题讨论】:
【参考方案1】:感谢ptrblck 我能够解决它。
我可以将一个新的卷积层定义为conv
,根据示例,我可以使用 -
weights = ch.Tensor([[0, 0, 0], [0, 1, 0], [0, 0, 0]]).unsqueeze(0).unsqueeze(0)
weights.requires_grad = True
conv = nn.Conv2d(1, 1, kernel_size=3, stride=1, padding=1, bias=False)
with ch.no_grad():
conv.weight = nn.Parameter(weights)
然后我可以继续使用conv
作为我的常规nn.Conv2d
层。
【讨论】:
【参考方案2】:我认为更简单的解决方案是:
deconv = nn.ConvTranspose2d(
in_channels=channel_dim, out_channels=channel_dim,
kernel_size=kernel_size, stride=stride,
bias=False, padding=1, output_padding=1
)
deconv.weight.data.copy_(
get_upsampling_weight(channel_dim, channel_dim, kernel_size)
)
换句话说就是使用copy_
【讨论】:
以上是关于在 pytorch 中为 CNN 设置自定义内核的主要内容,如果未能解决你的问题,请参考以下文章
Keras CIFAR-10分类 自定义simple CNN篇