梯度下降法

Posted 2021-03-11 fcfc940503

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了梯度下降法相关的知识，希望对你有一定的参考价值。

梯度下降法用处：寻找目标函数最小化的方法。

也就是求函数的局部最小值。

梯度的数学解释：梯度：https://baike.baidu.com/item/%E6%A2%AF%E5%BA%A6/13014729?fr=aladdin

梯度下降法的简单解释：

梯度下降法就好比一个蒙着眼睛的人下山，每次在负梯度最大的方向，向前走一步，走出一步后，比较前后的的落差，若落差小于一定阈值，则认为到达山谷，若落差大于阈值，则继续向前走，直到到达山谷。

技术图片

数学公式：

技术图片

也可以这样表示

技术图片

$J是关于$

α太小，可能导致迟迟走不到最低点，太大，会导致错过最低点！

在梯度下降法中调优比较重要的是3个因素，步长、初始值、归一化。

步长：步长太小，收敛慢，步长太大，会远离最优解。所以需要从小到大，分别测试，选出一个最优解。
初始值：随机选取初始值，当损失函数是非凸函数时，找到的解可能是局部最优解，需要多测试几次，从局部最优解中选出最优解。当损失函数是凸函数时，得到的解就是最优解。
归一化：如果不归一化，会收敛的很慢，会形成之字的路线。

由此可以看出梯度下降法的不同方法（有多种梯度下降法）就是根据这3个因素的选取来命名的。

以上是关于梯度下降法的主要内容，如果未能解决你的问题，请参考以下文章