卷积神经网络:反向传播过程的代码实现
Posted 智能航空发动机
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了卷积神经网络:反向传播过程的代码实现相关的知识,希望对你有一定的参考价值。
本文主要讲解卷积神经网络(CNN)反向传播过程的matlab代码实现。
01
简介
02
代码实现
梯度下降要优化的目标函数,主要分为两部分:一部分是由于分类器输出结果和真实结果的差异引起的误差,另一部分是对权重w的正则约束。
logp = log(probs);
index = sub2ind(size(logp),mb_labels',1:size(probs,2));
ceCost = -sum(logp(index));
wCost = lambda/2 * (sum(Wd(:).^2)+sum(Wc(:).^2));
cost = ceCost/numImages + wCost;
(二)softmax层
output = zeros(size(probs));
output(index) = 1;
DeltaSoftmax = probs - output;
注:笔者做过利用Levenberg–Marquardt算法优化网络结构,此时即需要平方差损失函数。
(三)全连接层
Wd_grad = (1./numImages) .* DeltaSoftmax*activationsPooled'+lambda*Wd;
bd_grad = (1./numImages) .* sum(DeltaSoftmax,2);
(四)池化层
DeltaPool = reshape(Wd' * DeltaSoftmax,outputDim,outputDim,numFilters,numImages);
DeltaUnpool = zeros(convDim,convDim,numFilters,numImages);
for imNum = 1:numImages
for FilterNum = 1:numFilters
unpool = DeltaPool(:,:,FilterNum,imNum);
DeltaUnpool(:,:,FilterNum,imNum) = kron(unpool,ones(poolDim))./(poolDim ^ 2);
end
end
(五)卷积层
% 在求出误差关于池化层输入的导数后,再点乘激活函数的导数。
DeltaConv = DeltaUnpool .* activations .* (1 - activations);
% 卷积层偏置的代码
bc_grad = zeros(size(bc));
for filterNum = 1:numFilters
error = DeltaConv(:,:,filterNum,:);
bc_grad(filterNum) = (1./numImages) .* sum(error(:));
end
% 卷积层权重的代码
Wc_grad = zeros(filterDim,filterDim,numFilters);
% 旋转所有DealtaConv:下面的conv2在函数内部会自动旋转180度,
% 所以在这里旋转是为了抵消conv2旋转的影响。
for filterNum = 1:numFilters
for imNum = 1:numImages
error = DeltaConv(:,:,filterNum,imNum);
DeltaConv(:,:,filterNum,imNum) = rot90(error,2);
end
end
for filterNum = 1:numFilters
for imNum = 1:numImages
Wc_grad(:,:,filterNum) = Wc_grad(:,:,filterNum) + conv2(images(:,:,imNum),DeltaConv(:,:,filterNum,imNum),'valid');
end
end
Wc_grad = (1./numImages) .* Wc_grad + lambda*Wc;
以上是关于卷积神经网络:反向传播过程的代码实现的主要内容,如果未能解决你的问题,请参考以下文章