深度学习-计算机视觉-基础学习笔记-02
Posted weixin_43739821
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深度学习-计算机视觉-基础学习笔记-02相关的知识,希望对你有一定的参考价值。
卷积神经网络
Convolutional Neural Networks—CNN,其与常规神经网络的构想基本一致,不同的是需要训练卷积层,因为其更能保留输入的空间结构。
前面我们提到了全连接层的概念,将一个32323的照片像素提取并展开,得到一个3072维的向量,将其与10*3072的权值矩阵相乘得到激活值。
至于卷积层和全连接层的主要区别在于卷积层可以保全空间结构,比如上面中的图片不再将它展开成长向量,保持图片的结构,我们的权重W转为一些小的卷积核,将其在整个图像上滑动计算每一个空间定位时的点积结果,也就是将卷积核每个位置元素和与之对应图像区域的像素值相乘再加上偏置项。在做点积运算时我们会将这个553的块及对应的输入数据快转开成一个向量,将对应的每个空间位置元素进行相乘然后相加。
我们如何滑动卷积核并遍历所有空间位置呢,将这个卷积核从左上方的边角处开始,并且让其遍历输入的所有像素点,每一次点积运算都会在我们输出激活映射中产生一个值之后继续滑动卷积核,最简单的方式是一个个像素地滑动并相应的填满我们的输出激活映射或者其它滑动方式,比如每次滑动俩个像素点这样得到的是不同尺寸大小的输出。
当我们在处理一个卷积层时往往希望用到多种卷积核,因为每一种卷积核都可以从输入中得到一种特殊的模式或者概念,如果说我们有六个卷积核每个尺寸都是553,这样我们就会得到一个6层的尺寸大小是28286(每一个的尺寸是28281)的激活映射。
卷积神经网络基本上是由多个卷积层组成的一个序列,一个图片在输入之后输出最终结果之前的这些中间结果就是卷积层,它们依次堆叠,就像之前在神经网络中那样堆叠简单的线性层一样,之后我们将会用激活函数对其逐一处理,得到一些ReLU、Conv和池化层等东西,之后得到一系列的这些层,每一个都有一个输出,该输出又作为下一个卷积层的输入。
这些层采用多个卷积核,每一个卷积核会产生一个激活映射,最后的结果是你完成了对这组卷积核的学习,前面的卷积核一般代表了一些低阶的图像特征比如边缘特征,而对于中间层你可以得到一些更加复杂的图像特征比如边角和斑点等,对于那些高级特征你可以获得一些比斑点更加丰富的内容。
以上是关于深度学习-计算机视觉-基础学习笔记-02的主要内容,如果未能解决你的问题,请参考以下文章