通过在卷积神经网络中使用平均池来理解对分辨率的影响。

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了通过在卷积神经网络中使用平均池来理解对分辨率的影响。相关的知识,希望对你有一定的参考价值。

我使用的是 colorization CIFAR-10数据集上的代码,我遇到了这一行。

downsize_module = nn.Sequential(nn.AvgPool2d(2), nn.AvgPool2d(2),  nn.Upsample(scale_factor=2), .Upsample(scale_factor=2))

"平均池化 "用了两次,那什么是 "平均池化"?resolution of output image?

这是我的理解。

例如,如果我们有 8*8 原始输入图像,第1个平均池(2*2)将给出4*4作为输出,第2个平均池(2*2)将给出2*2作为输出。

输出图像的分辨率是=116的输入图像的像素.所以,在像素方面,它将是原始的116th,但在维度方面,它将是原始的14。

哪种说法是正确的?是以像素为单位的116倍,还是以尺寸为单位的14倍。

答案

在这两种情况下,你给出的信息是一样的,你只需要指定你所说的单位。边缘的像素或像素总数。如果你的图像是正方形的,那么总的像素数的比例是边缘像素数的平方。通常,当提到总像素数时(例如在摄影中),通常会看到这样的数字。分辨率=10.4Mp或3.2kp. 另一方面,当谈到屏幕时,分辨率通常是指图像的高度,以像素为单位,例如:分辨率=1080意味着图像的高度为1920像素,或3.2kp。分辨率=1080意味着1920x1080像素的图像。

以上是关于通过在卷积神经网络中使用平均池来理解对分辨率的影响。的主要内容,如果未能解决你的问题,请参考以下文章

深度学习1-理解卷积神经网络(CNN)

设计一个卷积神经网络模型用于遥感图像的场景分类

设计一个卷积神经网络模型用于遥感图像的场景分类

非常详细的反卷积(transposed convolution)的理解

理解CNN卷积层与池化层计算

手写数字识别-卷积神经网络cnn(06-2)