学习中的梯度下降Ⅱ-学习率

Posted 郑哲

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了学习中的梯度下降Ⅱ-学习率相关的知识,希望对你有一定的参考价值。

调试梯度下降。用x轴上的迭代数绘制一个图。现在测量成本函数,J(θ)随迭代次数下降。如果J(θ)不断增加,那么你可能需要减少α。

 

自动收敛试验。如果该声明收敛(θ)小于E在一次迭代中减少,其中E是一些小的值,如10−3。然而,在实践中很难选择这个阈值。

 

它已被证明,如果学习率α足够小,那么J(θ)每次迭代都减小。

 

总结:
如果α太小,收敛速度慢
如果α太大:可能不会在每次迭代不收敛,从而降低。

 

以上是关于学习中的梯度下降Ⅱ-学习率的主要内容,如果未能解决你的问题,请参考以下文章

10的三次方怎么稀释梯度

梯度下降实用技巧II之学习率 Gradient descent in practice II -- learning rate

简单例子说明梯度下降momentum和学习率衰减

机器学习梯度下降与拟牛顿

梯度下降法原理和步骤

梯度下降(Gradient Descent)