定义: 卷积神经网络每一层输出的特征图(feature map)上的像素点在原始图像上映射的区域大小。

设网络共有 N 层卷积层, 卷积核采用正方形, 记第 i 层卷积核大小为 \\(size_i\\), 步长为 \\(stride_i\\), 当我们计算 \\(feature \\space map\\) 经过第 N 层卷积(或者池化), 输出的一个 "像素"对应的感受野时, 计算过程如下(从上到下计算, 计算最后所得值就是对应的感受野), \\(field_{N}\\) 表示经过第 N 层卷积之后的 feature map 上一个像素点对应的感受野(只看宽度).
\\[\\begin {align*}
&field_{N} = size_N \\\\
&\\quad \\quad \\vdots \\\\
&field_{i} = (field_{i+1} - 1) \\times stride_{i} + size_i \\\\
&\\quad \\quad \\vdots \\\\
&field_{1} = (field_{2} - 1) \\times stride_{1} + size_1\\\\
\\end {align*}
\\]
\\(field_{1}\\) 即为所求感受野.
\\(\\color{red}{举例如下(\\bf ZFNet)}\\):

第 8 层为最后一个 feature map 大小为 13x13 这一层, 171 为该层 3 个像素在图片的感受野大小
layer | size | stride | 计算 |
---|---|---|---|
8th | 3 | 1 | 3 |
7th | 3 | 1 | (3-1)×1 + 3 = 5 |
6th | 3 | 1 | (5-1)×1 + 3 = 7 |
5th | 3 | 1 | (7-1)×1 + 3 = 9 |
4th | 3 | 2 | (9-1)×2 + 3 = 19 |
3rd | 5 | 2 | (19-1)×2 + 5 = 41 |
2nd | 3 | 2 | (41-1)×2 + 3 = 83 |
1st | 7 | 2 | (83-1)×2 + 2 = 171 |