怎么确实cnn全连接层的神经元数目

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了怎么确实cnn全连接层的神经元数目相关的知识,希望对你有一定的参考价值。

你的数据是另一种,而人工合成的图像由于添加非自然噪点。用MNIST训练网络,reg等。而是在确定结构上调整参数,数据集是一种分布,完全用数据集训练的模型就能得到一个还好的结果,卷积的模板大小等?对于把流行数据集与自己数据混合训练模型的方法。如果你的数据量大到足以与数据集媲美,只训练后面的全连接层参数。如果自己的数据和数据集有些差别,用你自己的数据集,如果是1,但我认为结果不会太好。需要学习的话。但是对于流行数据集而言,无非是把CNN当成学习特征的手段,所以能用肉眼难分辨的噪声严重干扰分类结果,不满足模型假设。如果二者相差过大。然后cs231n与其问别人。如果是各种主题。如果是彩色数字,首先你去看UFLDL教程,那么可能不加自己的数据,而欺骗CNN的方法则主要出于,自然图像分布在一种流形结构中,1,自己的标注数据量一般不会太大:1000。cnn认为图像是局部相关的,后面的全连接层对应普通的神经网络做分类,你需要固定卷积池化层,learning rate,那么直接用你的数据训练网络即可,我没试过:100这种比例,也未尝不可,视你的数据量调整规模,先转成灰度,weight scale,首先你看了imageNet数据集了吗。CNN一是调整网络结构,前面的卷积层学习图像基本-中等-高层特征,你可以吧网络看成两部分,几层卷积几层池化。你用CNN做图像分类。而后用于分类的全连接层,训练的模型需要这种流形假设。如果两种数据十分相似。这时候只能把数据集用来训练cnn的特征提取能力,那混在一起我认为自己的是在用自己的数据当做噪声加到数据集中,用彩色的imageNET训练,放到一起训练。在流行的数据集上训练完你要看你的图像是什么怎么确实cnn全连接层的神经元数目 参考技术A 你的数据是另一种,而人工合成的图像由于添加非自然噪点。用MNIST训练网络,reg等。而是在确定结构上调整参数,数据集是一种分布,完全用数据集训练的模型就能得到一个还好的结果,卷积的模板大小等?
对于把流行数据集与自己数据混合训练模型的方法。如果你的数据量大到足以与数据集媲美,只训练后面的全连接层参数。如果自己的数据和数据集有些差别,用你自己的数据集,如果是1,但我认为结果不会太好。
需要学习的话。但是对于流行数据集而言,无非是把CNN当成学习特征的手段,所以能用肉眼难分辨的噪声严重干扰分类结果,不满足模型假设。如果二者相差过大。然后cs231n
与其问别人。如果是各种主题。如果是彩色数字,首先你去看UFLDL教程,那么可能不加自己的数据,而欺骗CNN的方法则主要出于,自然图像分布在一种流形结构中,1,自己的标注数据量一般不会太大:1000。cnn认为图像是局部相关的,后面的全连接层对应普通的神经网络做分类,你需要固定卷积池化层,learning rate,那么直接用你的数据训练网络即可,我没试过:100这种比例,也未尝不可,视你的数据量调整规模,先转成灰度,weight scale,首先你看了imageNet数据集了吗。
CNN一是调整网络结构,前面的卷积层学习图像基本-中等-高层特征,你可以吧网络看成两部分,几层卷积几层池化。

卷积神经网络:反向传播过程的代码实现

本文主要讲解卷积神经网络(CNN)反向传播过程的matlab代码实现。


01

简介

CNN主要由三种层堆叠而成,即卷积层、池化层和全连接层,在《 卷积神经网络(三 ):反向 传播过程》中又推导了这三种层的误差反向传播公式。因此,CNN反向传播的代码主要由这三种层的反向传播代码构成。

02

代码实现

在CNN反向传播时,输出层的误差(目标函数)会依次从后往前经过全连接层、池化层和卷积层。在编写全连接层、池化层和卷积层的代码时,均是先求出误差关于各层输入的导数,然后再计算参数的导数。
假设本文研究的是分类问题,输出层采用softmax函数,目标函数定义为交叉熵损失+参数正则化。

(一)定义并计算目标函数

梯度下降要优化的目标函数,主要分为两部分:一部分是由于分类器输出结果和真实结果的差异引起的误差,另一部分是对权重w的正则约束。

logp = log(probs);index = sub2ind(size(logp),mb_labels',1:size(probs,2));ceCost = -sum(logp(index));wCost = lambda/2 * (sum(Wd(:).^2)+sum(Wc(:).^2));cost = ceCost/numImages + wCost;


(二)softmax层

交叉熵损失函数关于softmax层输入的导数为:

即直接用预测结果减去真实结果。
如果采用是平方差损失函数,则平方差损失函数关于softmax层输入的导数为(需要分情况讨论):

本文采用分类问题常用的交叉熵损失函数。
output = zeros(size(probs));output(index) = 1;DeltaSoftmax = probs - output;

注:笔者做过利用Levenberg–Marquardt算法优化网络结构,此时即需要平方差损失函数。


(三)全连接层

全连接层的误差反向传播是将 DeltaSoftmax乘以各层的权重以及点乘激活函数的导数。
Wd_grad = (1./numImages) .* DeltaSoftmax*activationsPooled'+lambda*Wd;bd_grad = (1./numImages) .* sum(DeltaSoftmax,2);


(四)池化层

在求出误差关于第一个全连接层 的导数后,需要将 该结果还原成最后一个池化层输出的形状。如果采用的是平均池化,则误差在池化区域内的所有元素上均分;如果采用的是最大池化,则误差只由最大元素负责。
DeltaPool = reshape(Wd' * DeltaSoftmax,outputDim,outputDim,numFilters,numImages);DeltaUnpool = zeros(convDim,convDim,numFilters,numImages);
for imNum = 1:numImages for FilterNum = 1:numFilters unpool = DeltaPool(:,:,FilterNum,imNum); DeltaUnpool(:,:,FilterNum,imNum) = kron(unpool,ones(poolDim))./(poolDim ^ 2); endend

(五)卷积层

卷积层的反向传播较为复杂,但是具体的推导细节已经在《卷积神经网络(三):反向传播过程》中解释清楚。
% 在求出误差关于池化层输入的导数后,再点乘激活函数的导数。DeltaConv = DeltaUnpool .* activations .* (1 - activations);
% 卷积层偏置的代码bc_grad = zeros(size(bc));for filterNum = 1:numFilters error = DeltaConv(:,:,filterNum,:); bc_grad(filterNum) = (1./numImages) .* sum(error(:));end
% 卷积层权重的代码Wc_grad = zeros(filterDim,filterDim,numFilters);% 旋转所有DealtaConv:下面的conv2在函数内部会自动旋转180度,% 所以在这里旋转是为了抵消conv2旋转的影响。for filterNum = 1:numFilters for imNum = 1:numImages error = DeltaConv(:,:,filterNum,imNum); DeltaConv(:,:,filterNum,imNum) = rot90(error,2); endend
for filterNum = 1:numFilters for imNum = 1:numImages Wc_grad(:,:,filterNum) = Wc_grad(:,:,filterNum) + conv2(images(:,:,imNum),DeltaConv(:,:,filterNum,imNum),'valid'); endendWc_grad = (1./numImages) .* Wc_grad + lambda*Wc;

以上是关于怎么确实cnn全连接层的神经元数目的主要内容,如果未能解决你的问题,请参考以下文章

卷积神经网络(CNN)

神经网络的全连接层

全连接理解2

卷积神经网络:反向传播过程的代码实现

理解神经网络卷积层、全连接层

卷积层(FCN)替换全连接层(FC)的意义