一起入门DeepLearning中科院深度学习_期末复习题2018-2019第二题:求梯度

Posted vector<>

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了一起入门DeepLearning中科院深度学习_期末复习题2018-2019第二题:求梯度相关的知识,希望对你有一定的参考价值。

专栏介绍:本栏目为 “2022春季中国科学院大学王亮老师的深度学习” 课程记录,这门课程与自然语言处理以及机器学习有部分知识点重合,重合的部分不再单独开博客记录了,有需要的读者可以移步 💗自然语言处理专栏和💗机器学习专栏。 如果感兴趣的话,就和我一起入门DL吧🥰

🍓 2018-2019 学年第二学期期末试题

想了解梯度下降算法可以看这篇博客:【一起入门NLP】中科院自然语言处理第3课-前馈神经网络DNN(反向传播+梯度下降),这个题目完全是数学问题,一个很难算的数学问题😅下面是两位师兄的参考答案:

答案一:


答案二:
1. 将各层的计算公式按标量形式展开,下标中带括号的表示在矩阵或向量中对应的位置:
z 1 ( j ) = ∑ m = 1 d W 1 ( j m ) x ( m ) + b 1 ( j ) z_1(j)=\\sum_m=1^d W_1(j m) x_(m)+b_1(j) z1(j)=m=1dW1(jm)x(m)+b1(j)
h 1 ( j ) = Re ⁡ L U ( z 1 ( j ) ) h_1(j)=\\operatornameRe L U\\left(z_1(j)\\right) h1(j)=ReLU(z1(j))
z 2 ( i ) = ∑ n = 1 h W 2 ( i n ) h 1 ( n ) + b 2 ( i ) z_2(i)=\\sum_n=1^h W_2(i n) h_1(n)+b_2(i) z2(i)=n=1hW2(in)h1(n)+b2(i)
h 2 ( i ) = Re ⁡ L U ( z 2 ( i ) ) h_2(i)=\\operatornameRe L U\\left(z_2(i)\\right) h2(i)=ReLU(z2(i))
y ( i ) = soft ⁡ max ⁡ ( h 2 ( i ) ) = e h 2 ( i ) ∑ g e h 2 ( i ) ) y_(i)=\\operatornamesoft \\max \\left(h_2(i)\\right)=\\frace^h_2(i)\\sum^g e^\\left.h_2(i)\\right) y(i)=softmax(h2(i))=geh2(i)eh2(i))
J = C E ( y , y ^ ) = − ∑ i ′ = 1 g y ( i ′ ) log ⁡ ( y ^ ( i ′ ) ) J=C E(y, \\haty)=-\\sum_i^\\prime=1^g y_\\left(i^\\prime\\right) \\log \\left(\\haty_\\left(i^\\prime\\right)\\right) J=CE(y,y^)=i=1gy(i)log(y^(i))

2. 计算交叉熵的导数:
∂ J ∂ ( y ^ ( i ′ ) ) = − y ( i ′ ) y ^ ( i ′ ) \\frac\\partial J\\partial\\left(\\haty_\\left(i^\\prime\\right)\\right)=-\\fracy_\\left(i^\\prime\\right)\\haty_\\left(i^\\prime\\right) (y^(i))J=y^(i)y(i)

3. Softmax求导:
k = i \\mathrmk=\\mathrmi k=i
∂ y ^ ( i ) ∂ h 2 ( k ) = ∂ y ^ ( i ) ∂ h 2 ( i ) = e h 2 ( i ) ∑ i ′ = 1 g e h 2 ( i ) − ( e h 2 ( i ) ) 2 ( ∑ i ′ = 1 g e h 2 ( i ) ) 2 = y ^ ( i ) ( 1 − y ^ ( i ) ) \\frac\\partial \\haty_(i)\\partial h_2(k)=\\frac\\partial \\haty_(i)\\partial h_2(i)=\\frace^h_2(i) \\sum_i^\\prime=1^g e^h_2(i)-\\left(e^h_2(i)\\right)^2\\left(\\sum_i^\\prime=1^g e^h_2(i)\\right)^2=\\haty_(i)\\left(1-\\haty_(i)\\right) h2(k)y^(i)=h2(i)y^(i)=(i=1geh2(i))2eh2(i)i=1ge一起入门DeepLearning中科院深度学习_期末复习题2018-2019第二题:求梯度

推荐序:《Deeplearning4j 快速入门》课程,深度学习必备秘籍

推荐序:《Deeplearning4j 快速入门》课程,深度学习必备秘籍

GitHub | 机器学习&深度学习&nlp&cv从入门到深入全套资源分享

入门深度学习的必备数学知识

[转]机器学习深度学习数据挖掘各种资源整理