卷积层在神经网络中如何运算?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了卷积层在神经网络中如何运算?相关的知识,希望对你有一定的参考价值。

参考技术A

卷积神经网络(Convolutional Neural Networks, CNN)的核心是进行卷积运算操作。在实际应用中往往采用多层网络结构,因此又被称为深度卷积神经网络。本文将从单个卷积的计算出发,带大家掌握卷积层在神经网络中的运算方法。

2.1 单个卷积的计算

要想了解卷积层在神经网络中的计算过程,我们首先需要了解单个“卷积”是如何运作的。

想必大家在学习CNN的过程中都见过下图( 出处在此 ,这上面有各种各样的卷积gif图):

input_shape=(5,5),kernelsize=(3,3),padding=‘same’,stride=1,output_shape=(5,5)

在此图中:

在此次计算中:

Ps: 在实际应用中,每一个输出的特征图还会配备一个偏置bais,在上图中无表示。

2.2 卷积层在神经网络中的运算

了解完单个卷积是如何计算的之后,我们就可以从神经网络的角度来看‘卷积层’的运算过程了。下图展示的是输入三通图像(8*8*3)经一层卷积结构,输出两通特征图(8*8*2)的计算过程:

卷积参数:input_shape=(8,8,3),kernelsize=(3,3),padding=‘same’,stride=1,output_shape=(8,8,2)

在此图中:

在此次卷积层的运算中:

首先我们来关注一下输入和输出,他俩的尺度都是(8*8),而输入是3通道,输出是2通道(深度学习中不管干啥一定要先看输入输出,对一层是这样,对整个模型也是这样)。

其次就准备进入我们最熟悉的卷积核计算了,可是在此之前我们得知道,这个运算过程中到底发生了几次卷积核计算呢?有的朋友可能要说,卷积的一大特性就是‘权值共享’,有几通输出就有几个卷积核,每个卷积核把输入特征图从头扫到尾。然而这个其实是不对的!

实际上,在卷积核计算数量问题上,应该是“ 有几通道的输出就有几套卷积核,每套内的卷积核数量与输入通道数相等 ”,就像我在上图中所画的:

至此,这一个卷积层的运算就全部完成了。

2.3 “可训练参数”验证

毕竟空口无凭,下面我来通过“ 可训练参数 ”的数量,来为大家验证一下卷积层是不是按我说的这么运算的。大家应该知道,一个卷积层内的“可训练参数”,其实就是指的卷积核里的那些值,以及要加的偏置量,那么如果按照前面描述的计算方法来看,一个卷积层内的“可训练参数有多少呢”?我们可知:

由此可得到:

那么按理说可训练参数量应为:

让我们用keras的summary()来验证一下:

很棒!

记住,普通卷积层的可训练参数量为:

Ps: 还有一个衡量模型大小、复杂度的量叫做“理论计算量FLOPs”(floating point operations)。它通常只考虑Conv、FC等参数层的乘、加操作的数量,并且“纯加”操作也会被忽略(例如bias)。卷积层运算中的FLOPs计算公式为:

Ps: 这里还要为大家明确一个“感受野”的概念,简单来讲就是卷积神经网络中的某一层特征图上的一个点,对应到原图上可以关联到多少个点,我们用一张图来解释一下:

上图展示的是一个3层一维卷积,kernel_size=3,我们可以看到:顶层左一的像素与底层左起7个像素值有关,这时候就代表它的感受野有7。我们可以显而易见的得出以下两个结论:

这个感受野在后续的卷积的拆分讲解中还要用到。

卷积神经网络中卷积是什么为什么要使用卷积核运算

一图片识别为例来介绍一下个人理解:卷积是为了来得到特征值得,那么卷积的工作原理是什么呢?好吧就是你想的那样,卷积核运算正是卷积工作来提取特征(即图片的边缘轮廓)的原理
借用吴恩达老师的一张图
*
*
在这里插入图片描述

正如图片中所示这是用来进行垂直边缘性检测的,第一个方阵代表一张灰度图片里面数值越小代表颜色越深由下面的颜色版可以看出黑和白有一个边缘是垂直的,而卷积核是由白,灰,黑构成的图片被卷积核运算后得到了第三个色板我们可以明显看到中间是白色的这就是这张黑白照片里面图像的一个边缘由于这张图片比较小(6*6)得到的边缘不够明显不够精确,但是我们通常用来剪测的图片都是很大的。
看到这你可能会问图片里的图像边缘又不是都是垂直的比如这张:

里面的图像是怎么得到特征值得呢知道它是佩奇的呢

回顾图一我们看到这个卷积核是一列1和0和-1组成的运算后得到了一列0和两列30和一列0从而判断出了特征值也就是分界线的位置,所以要想得到特征值我们就要改变卷积核里面的数值但是什么数值适合识别我就不介绍了大家可以自己查查。
*
*
在这里插入图片描述

以上是关于卷积层在神经网络中如何运算?的主要内容,如果未能解决你的问题,请参考以下文章

神经网络推理加速: 合并卷积和BN层运算原理及实验

神经网络推理加速: 合并卷积和BN层运算原理及实验

越来越卷,教你使用Python实现卷积神经网络(CNN)

越来越卷,教你使用Python实现卷积神经网络(CNN)

卷积神经网络中的损失函数

卷积神经网络与典型结构