学习中的梯度下降Ⅱ-学习率
Posted 郑哲
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了学习中的梯度下降Ⅱ-学习率相关的知识,希望对你有一定的参考价值。
调试梯度下降。用x轴上的迭代数绘制一个图。现在测量成本函数,J(θ)随迭代次数下降。如果J(θ)不断增加,那么你可能需要减少α。
自动收敛试验。如果该声明收敛(θ)小于E在一次迭代中减少,其中E是一些小的值,如10−3。然而,在实践中很难选择这个阈值。
它已被证明,如果学习率α足够小,那么J(θ)每次迭代都减小。
总结:
如果α太小,收敛速度慢
如果α太大:可能不会在每次迭代不收敛,从而降低。
以上是关于学习中的梯度下降Ⅱ-学习率的主要内容,如果未能解决你的问题,请参考以下文章
梯度下降实用技巧II之学习率 Gradient descent in practice II -- learning rate