[BPnet识别MNIST04]神经网络的变量和公式分析

Posted AIplusX

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[BPnet识别MNIST04]神经网络的变量和公式分析相关的知识,希望对你有一定的参考价值。

写在前面

今天正式进入前馈神经网络的公式推导环节,综合数据处理难度和公式推导难度以及神经网络的易理解性,我将之前放出的神经网络做了一些调整,之后给出。那么这篇文章主要进行神经网络的变量讲解,以及公式分析

正文

主要内容在我的古月居博客:
[BPnet识别MNIST04]神经网络的变量和公式分析

神经网络图

神经网络图如下所示:

变量和公式分析

在神经网络中主要有这几个参数:

y ^ 1 , y 1 , γ 1 , υ 11 , ω 1 , θ 11 , x 1 , n ^ 1 , m ^ 1 , n 1 , m 1 , E k \\hat{y}_{1},y_{1},\\gamma_{1},\\upsilon_{11},\\omega_{1},\\theta_{11},x_{1},\\hat{n}_{1},\\hat{m}_{1},n_{1},m_{1},E_{k} y^1y1γ1υ11ω1θ11x1n^1m^1n1m1Ek

让我来按顺序进行介绍:

y ^ 1 \\hat{y}_{1} y^1:是神经网络的最终计算输出;
y 1 y_{1} y1:图像的标签;
γ 1 \\gamma_{1} γ1:第二个隐层到输出层的权重;
υ 11 \\upsilon_{11} υ11:第一个隐层到第二个隐层的权重;
ω 1 \\omega_{1} ω1:输入层到第一个隐层的权重;
θ 11 \\theta_{11} θ11:第一个隐层的阈值;
x 1 x_{1} x1:输入层数据;
n ^ 1 \\hat{n}_{1} n^1:第二个隐层神经元的输出;
m ^ 1 \\hat{m}_{1} m^1:第一个隐层神经元的输出;
n 1 n_{1} n1:第二个隐层神经元的输入;
m 1 m_{1} m1:第一个隐层神经元的输入;
E k E_{k} Ek:均方误差函数。

从第一个隐层到第二个隐层的公式:

从第二个隐层到输出层的公式:

写出了各层的公式之后就可以进行梯度下降的公式推导啦,明天更新~

latex公式源码:


\\documentclass{article} 
\\title{AIplusX} 
\\author{AIplusX} 
\\begin{document} 
	\\ 
	\\\\$ \\hat{y}_{1} = f(l_{1}') = f(\\hat{n}_{1} * \\gamma_{1} + \\hat{n}_{2} * \\gamma_{2} +
	\\hat{n}_{3} * \\gamma_{3} +\\hat{n}_{4} * \\gamma_{4} - \\theta_{3}) $
	\\\\
	\\\\ $ \\hat{n}_{1} = f(l_{2}')= f(\\hat{m}_{1} * \\upsilon_{11} + \\hat{m}_{2} * \\upsilon_{21} +
	\\hat{m}_{3} * \\upsilon_{31} +\\hat{m}_{4} * \\upsilon_{41} - \\theta_{21}) $
	\\\\
	\\\\$ \\hat{n}_{2} = f(l_{2}')= f(\\hat{m}_{1} * \\upsilon_{12} + \\hat{m}_{2} * \\upsilon_{22} +
	\\hat{m}_{3} * \\upsilon_{32} +\\hat{m}_{4} * \\upsilon_{42} - \\theta_{22}) $
		\\\\
	\\\\$ \\hat{n}_{3} = f(l_{2}')= f(\\hat{m}_{1} * \\upsilon_{13} + \\hat{m}_{2} * \\upsilon_{23} +
	\\hat{m}_{3} * \\upsilon_{33} +\\hat{m}_{4} * \\upsilon_{43} - \\theta_{23}) $
		\\\\
	\\\\$ \\hat{n}_{4} = f(l_{2}')= f(\\hat{m}_{1} * \\upsilon_{14} + \\hat{m}_{2} * \\upsilon_{24} +
	\\hat{m}_{3} * \\upsilon_{34} +\\hat{m}_{4} * \\upsilon_{44} - \\theta_{24}) $
	\\\\
	\\\\$ \\hat{m}_{1} = f(l_{3}')= f(x_{1} * \\omega_{1} - \\theta_{11}) $
	\\\\
	\\\\$ \\hat{m}_{2} = f(l_{3}')= f(x_{1} * \\omega_{2} - \\theta_{12}) $
	\\\\
	\\\\$ \\hat{m}_{3} = f(l_{3}')= f(x_{1} * \\omega_{3} - \\theta_{13}) $
	\\\\
	\\\\$ \\hat{m}_{4} = f(l_{3}')= f(x_{1} * \\omega_{4} - \\theta_{14}) $
	\\\\
	\\\\$E_{k} = \\frac{1}{2} * ( \\hat{y}_{1} - y)^{2}$
	\\\\
	\\\\$ \\frac{\\partial E_{k}}{\\partial \\upsilon_{11}} = \\frac{\\partial E_{k}}{\\partial \\hat{y}_{1}} *
		\\frac{\\partial \\hat{y}_{1}}{\\partial \\hat{n}_{1}} * \\frac{\\partial \\hat{n}_{1}}{\\partial \\upsilon_{11}} + 
		\\frac{\\partial E_{k}}{\\partial \\hat{y}_{2}} *
		\\frac{\\partial \\hat{y}_{2}}{\\partial \\hat{n}_{2}} * \\frac{\\partial \\hat{n}_{2}}{\\partial \\upsilon_{11}} + 
		\\frac{\\partial E_{k}}{\\partial \\hat{y}_{3}} *
		\\frac{\\partial \\hat{y}_{3}}{\\partial \\hat{n}_{3}} * \\frac{\\partial \\hat{n}_{3}}{\\partial \\upsilon_{11}} + 
		\\frac{\\partial E_{k}}{\\partial \\hat{y}_{4}} *
		\\frac{\\partial \\hat{y}_{4}}{\\partial \\hat{n}_{4}} * \\frac{\\partial \\hat{n}_{4}}{\\partial \\upsilon_{11}}  
		$

\\end{document}

正文

主要内容在我的古月居博客:
[BPnet识别MNIST04]神经网络的变量和公式分析

以上是关于[BPnet识别MNIST04]神经网络的变量和公式分析的主要内容,如果未能解决你的问题,请参考以下文章

[BPnet识别MNIST07]神经网络的实现以及调优

[BPnet识别MNIST03]MNIST数据降维以及神经网络建立

[BPnet识别MNIST09]神经网络的调试

[BPnet识别MNIST08]神经网络参数初始值对于模型结果的影响

[BPnet识别MNIST01]利用conda建立python工程

[BPnet识别MNIST02]MNIST字符集下载以及python读取