[BPnet识别MNIST04]神经网络的变量和公式分析
Posted AIplusX
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[BPnet识别MNIST04]神经网络的变量和公式分析相关的知识,希望对你有一定的参考价值。
写在前面
今天正式进入前馈神经网络的公式推导环节,综合数据处理难度和公式推导难度以及神经网络的易理解性,我将之前放出的神经网络做了一些调整,之后给出。那么这篇文章主要进行神经网络的变量讲解,以及公式分析。
正文
主要内容在我的古月居博客:
[BPnet识别MNIST04]神经网络的变量和公式分析
神经网络图
神经网络图如下所示:
变量和公式分析
在神经网络中主要有这几个参数:
y ^ 1 , y 1 , γ 1 , υ 11 , ω 1 , θ 11 , x 1 , n ^ 1 , m ^ 1 , n 1 , m 1 , E k \\hat{y}_{1},y_{1},\\gamma_{1},\\upsilon_{11},\\omega_{1},\\theta_{11},x_{1},\\hat{n}_{1},\\hat{m}_{1},n_{1},m_{1},E_{k} y^1,y1,γ1,υ11,ω1,θ11,x1,n^1,m^1,n1,m1,Ek
让我来按顺序进行介绍:
y
^
1
\\hat{y}_{1}
y^1:是神经网络的最终计算输出;
y
1
y_{1}
y1:图像的标签;
γ
1
\\gamma_{1}
γ1:第二个隐层到输出层的权重;
υ
11
\\upsilon_{11}
υ11:第一个隐层到第二个隐层的权重;
ω
1
\\omega_{1}
ω1:输入层到第一个隐层的权重;
θ
11
\\theta_{11}
θ11:第一个隐层的阈值;
x
1
x_{1}
x1:输入层数据;
n
^
1
\\hat{n}_{1}
n^1:第二个隐层神经元的输出;
m
^
1
\\hat{m}_{1}
m^1:第一个隐层神经元的输出;
n
1
n_{1}
n1:第二个隐层神经元的输入;
m
1
m_{1}
m1:第一个隐层神经元的输入;
E
k
E_{k}
Ek:均方误差函数。
从第一个隐层到第二个隐层的公式:
从第二个隐层到输出层的公式:
写出了各层的公式之后就可以进行梯度下降的公式推导啦,明天更新~
latex公式源码:
\\documentclass{article}
\\title{AIplusX}
\\author{AIplusX}
\\begin{document}
\\
\\\\$ \\hat{y}_{1} = f(l_{1}') = f(\\hat{n}_{1} * \\gamma_{1} + \\hat{n}_{2} * \\gamma_{2} +
\\hat{n}_{3} * \\gamma_{3} +\\hat{n}_{4} * \\gamma_{4} - \\theta_{3}) $
\\\\
\\\\ $ \\hat{n}_{1} = f(l_{2}')= f(\\hat{m}_{1} * \\upsilon_{11} + \\hat{m}_{2} * \\upsilon_{21} +
\\hat{m}_{3} * \\upsilon_{31} +\\hat{m}_{4} * \\upsilon_{41} - \\theta_{21}) $
\\\\
\\\\$ \\hat{n}_{2} = f(l_{2}')= f(\\hat{m}_{1} * \\upsilon_{12} + \\hat{m}_{2} * \\upsilon_{22} +
\\hat{m}_{3} * \\upsilon_{32} +\\hat{m}_{4} * \\upsilon_{42} - \\theta_{22}) $
\\\\
\\\\$ \\hat{n}_{3} = f(l_{2}')= f(\\hat{m}_{1} * \\upsilon_{13} + \\hat{m}_{2} * \\upsilon_{23} +
\\hat{m}_{3} * \\upsilon_{33} +\\hat{m}_{4} * \\upsilon_{43} - \\theta_{23}) $
\\\\
\\\\$ \\hat{n}_{4} = f(l_{2}')= f(\\hat{m}_{1} * \\upsilon_{14} + \\hat{m}_{2} * \\upsilon_{24} +
\\hat{m}_{3} * \\upsilon_{34} +\\hat{m}_{4} * \\upsilon_{44} - \\theta_{24}) $
\\\\
\\\\$ \\hat{m}_{1} = f(l_{3}')= f(x_{1} * \\omega_{1} - \\theta_{11}) $
\\\\
\\\\$ \\hat{m}_{2} = f(l_{3}')= f(x_{1} * \\omega_{2} - \\theta_{12}) $
\\\\
\\\\$ \\hat{m}_{3} = f(l_{3}')= f(x_{1} * \\omega_{3} - \\theta_{13}) $
\\\\
\\\\$ \\hat{m}_{4} = f(l_{3}')= f(x_{1} * \\omega_{4} - \\theta_{14}) $
\\\\
\\\\$E_{k} = \\frac{1}{2} * ( \\hat{y}_{1} - y)^{2}$
\\\\
\\\\$ \\frac{\\partial E_{k}}{\\partial \\upsilon_{11}} = \\frac{\\partial E_{k}}{\\partial \\hat{y}_{1}} *
\\frac{\\partial \\hat{y}_{1}}{\\partial \\hat{n}_{1}} * \\frac{\\partial \\hat{n}_{1}}{\\partial \\upsilon_{11}} +
\\frac{\\partial E_{k}}{\\partial \\hat{y}_{2}} *
\\frac{\\partial \\hat{y}_{2}}{\\partial \\hat{n}_{2}} * \\frac{\\partial \\hat{n}_{2}}{\\partial \\upsilon_{11}} +
\\frac{\\partial E_{k}}{\\partial \\hat{y}_{3}} *
\\frac{\\partial \\hat{y}_{3}}{\\partial \\hat{n}_{3}} * \\frac{\\partial \\hat{n}_{3}}{\\partial \\upsilon_{11}} +
\\frac{\\partial E_{k}}{\\partial \\hat{y}_{4}} *
\\frac{\\partial \\hat{y}_{4}}{\\partial \\hat{n}_{4}} * \\frac{\\partial \\hat{n}_{4}}{\\partial \\upsilon_{11}}
$
\\end{document}
正文
主要内容在我的古月居博客:
[BPnet识别MNIST04]神经网络的变量和公式分析
以上是关于[BPnet识别MNIST04]神经网络的变量和公式分析的主要内容,如果未能解决你的问题,请参考以下文章
[BPnet识别MNIST03]MNIST数据降维以及神经网络建立
[BPnet识别MNIST08]神经网络参数初始值对于模型结果的影响