卷积神经网络:发展史与输入层

Posted 大数据技术宅

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了卷积神经网络:发展史与输入层相关的知识,希望对你有一定的参考价值。

       提到深度学习,想必各位小伙伴对卷积神经网络(CNN)一词一定不陌生,那么卷积神经网络的发展史、网络结构中的输入层、卷积层、池化层、全链接层、输出层究竟是什么呢。从这里开始,笔者将带你一步步走进CNN(以理论为主,应用目前可以参考 2篇文章,也可以后台留言交流)。

发展史

卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,最早可以追溯到1986年BP算法( )的提出,1989年LeCun将其用到多层神经网络中,直到1998年LeCun提出LeNet-5模型,神经网络的雏形基本形成。但是在接下来的近10年里,由于一方面研究人员意识到多层神经网络在进行BP训练时计算量过大,另一方面SVM等浅层机器学习算法开始展露头角,卷积神经网络网络就一直处于低迷状态。

       直到2006年,Hiton在Science自然期刊上发表文章,CNN才再度觉醒,并取得长足发展。2012年,ImageNet大赛CNN一举夺魁,AlexNet的突破使计算机视觉模型成功跨进商业化产品的门槛,可谓是CNN的王者归来。2014年,谷歌研发出20层的VGG模型。同年,GoogleLeNet问世。2015年,何凯明推出的ResNet在ISLVRC和COCO上横扫所有选手,ResNet在网络结构上大胆创新,堪称深度学习发展史的一重要里程碑。下图为卷积神经网络常见的一个网络结构图例。

输入层

输入层即数据的输入,卷积神经网络的输入层输入并不必须是图片。只是由于卷积神经网络在计算机视觉领域应用更广些,所以大多人在谈及CNN时,默认输入的是图片。图片等非数字化的图像信息,在计算机中都是以像素的形式(把图片放大,我们将看到一个个格子,即为像素,参考下图),按照矩阵进行有序排列而成。像素是图像的最基本单位,像素值以矩阵方式保存。

卷积神经网络(一):发展史与输入层

如果是灰度图(我们通常说的黑白图),那么图像就是单通道的,图像中的每个像素只需要一个矩阵元素来保存,每个元素的取值范围为0~255,保存灰度图的矩阵格式如下,每一行和每一列交点上的元素值代表图像上对应位置的像素的灰度值。

卷积神经网络(一):发展史与输入层

如果是彩色图,那么图像就是多通道的,一个像素需要多个矩阵元素来保存,矩阵中的列包含多个子列,且子列数和通道数相同。保存RGB图像的矩阵见下面两张图:

卷积神经网络(一):发展史与输入层

备注:RGB就是利用“Red,Green,Blue”3种基本色调来表现繁多的颜色的,将基本色相混合成各种浓度,可以表现出多姿多彩的彩色图像(见下图)。

参考资料:

1、深度学习花书

2、深度学习图解

3、其他网络资源




你若喜欢,点个在看

以上是关于卷积神经网络:发展史与输入层的主要内容,如果未能解决你的问题,请参考以下文章

34-卷积神经网络(Conv)

嵌入式与神经网络(二):CNN卷积层

40深度卷积神经网络的发展史

卷积神经网络基础介绍1

卷积与池化

经典卷积网络的发展