C++卷积神经网络实例:tiny_cnn代码详解——convolutional_layer类结构信息之其他成员函数
Posted 山在岭就在
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C++卷积神经网络实例:tiny_cnn代码详解——convolutional_layer类结构信息之其他成员函数相关的知识,希望对你有一定的参考价值。
在上一篇博客中我们介绍了convolutional_layer类的基本结构及其成员变量、构造函数的相关信息,在这篇博文中我们对其中剩余的其他成员函数进行分析。首先把convolutional_layer类的结构图给出来:
可见,convolutional_layer类除了构造函数之外,还有另外两部分成员函数,一部分负责定义当前卷积层与前一层之间的连接关系,另一部分则完成convolutional_layer类的剩余辅助功能,例如返回相关属性、将权重矩阵和输出矩阵转换为图像格式输出等等。
一、层间连接规划函数
这部分函数主要负责定义连接矩阵,来设计卷积层与前一层之间的连接关系,主要包含两个函数和一个结构体类型,接下来它们进行一一介绍。
1.1 connection_table结构体
connection_table结构体实际上就是层间连接矩阵的基本原型,主要功能就是根据传入的参数来构建指定的连接矩阵。这个结构体提供了两个构造函数。其中一个构造函数算是缺省构造函数,另一个需要外部传入连接矩阵和对应矩阵的行数和列数:
第一个构造函数没啥可说的,就是默认生成一个空的连接矩阵(rows_ == 0 && cols_ == 0),另一个构造函数则本质上完成一个复制操作,通过标准库中的copy实现将用户自定义的连接矩阵传入connection_table内部:
connection_table(const bool *ar, size_t rows, size_t cols) : connected_(rows * cols), rows_(rows), cols_(cols) std::copy(ar, ar + rows * cols, connected_.begin()); //拷贝对应的连接标志位
此外connection_table结构体中还用另外两个成员函数is_connected()和is_empty()函数。is_connected()的函数体如下:
bool is_connected(size_t x, size_t y) const return is_empty() ? true : connected_[y * cols_ + x]; //这里空connection_table默认为全连接
is_connected()函数的功能是判断当前坐标(size_t x, size_t y)下的连接情况。举个例子,在主程序中我们人工定义了一个层间连接矩阵:
这个连接是遵循LeNet-5中第二卷积层与前一层的连接形式,这是一个6行16列矩阵,说明前一层的输出特征矩阵有6个、本层的卷积模板有16个,矩阵中“0”代表连接,“X”代表不连接,接下来举例分析一下这个矩阵的实际意义。比如,矩阵的第1行第2列为“0”,说明前一层的第一个输出特征矩阵和本层的第一个卷积核模板是连接的;再举个例子,矩阵中的第5行第6列为“X”,说明前一层的第5个输出特征矩阵和本层的第6个卷积模板是不连接的,没错,这个连接矩阵就是这个含义。而is_connected()这个函数的作用就是根据前一层和本层的索引来读取连接矩阵中对应的值(true or false)。
至于is_empty()函数,作用只有一个:判断当前矩阵是否为零阵:
bool is_empty() const return rows_ == 0 && cols_ == 0;
1.2 connect_kernel函数
connect_kernel()函数的作用是初始化卷积层的卷积核参数:
1.3 init_connection函数
init_connection()是初始化该卷积层的映射参数,包括卷积核权重和偏置,其中初始化卷积核权重是通过调用connect_kernel()函数来实现,初始化加性偏置则直接通过代码实现:
二、其他函数
接下来针对convolutional_layer类中的剩余成员函数做一下扫尾工作,主要包含weight_to_image()函数和一些属性返回函数。
2.1 weight_to_image函数
这个函数的作用是将该层卷积层中的卷积核权重转换成图像形式进行可视化显示。之所以添加这个函数,是因为在实际实验中经常需要将中间卷积层的卷积核权重进行输出,来判断网络的收敛情况、学习进度,同时借助卷积核来对卷积神经网络的特征提取原理做一些深入性的研究。这个函数大致可以分为两部分,首先需要对图像填充,然后在进行转换,在转换过程中涉及到工程中自定义中的image.h模块,有关image模块会在后续的博文中进行详细讲解。
2.2 属性返回函数
convolutional_layer类的最后一个部分,属性返回函数,顾名思义,返回类成员属性:
三、注意事项
1、连接矩阵的本质属性
在这里需要稍稍纠正一个说法问题,在上文中我们一直说“连接矩阵”,其实这里的连接矩阵本质上并不是Mat类型的矩阵,而是存储一系列布尔值的vector变量,具体上图:
至于connection变量,在connection_table结构体的内部给出了更为直接的定义:
2、is_connected()函数实现
is_connected()函数虽然功能很简单,但是其实现起来还是有一点小麻烦,比如说其主要的功能实现部分的代码:
故名思议,如果矩阵为零阵,返回ture,否则按索引值返回,问题是这里的connected_变量是一个vector而非中规中矩的二维矩阵,因此我们要通过人工定义的列数(cols_)来辅助完成定位(y * cols_ + x)。
3、“0”代表连接、“X”代表不连接
这通过一个宏定义来实现:
4、卷积网路的基本属性
这篇博文中提到了很多卷积神经网络中的专用术语,例如卷积核权重、加性偏执、全连接等等,有关卷积神经网络的基本原理可以参考之前我上传的一个牛人写的PPT,我当时读完之后,受益良多。
如果觉得这篇文章对您有所启发,欢迎关注我的公众号,我会尽可能积极和大家交流,谢谢。
以上是关于C++卷积神经网络实例:tiny_cnn代码详解——convolutional_layer类结构信息之其他成员函数的主要内容,如果未能解决你的问题,请参考以下文章
C++卷积神经网络实例:tiny_cnn代码详解(12)——从CNN中看多态性
C++卷积神经网络实例:tiny_cnn代码详解——fully_connected_layer层结构类分析
C++卷积神经网络实例:tiny_cnn代码详解(11)——层结构容器layers类源码分析
C++卷积神经网络实例:tiny_cnn代码详解(12)——从CNN中看多态性