牛顿法与梯度下降法数学公式推导过程

Posted justina

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了牛顿法与梯度下降法数学公式推导过程相关的知识,希望对你有一定的参考价值。

迭代更新数学公式推导过程

1、牛顿法

首先对于有n个变量的函数的一阶导数为

         技术图片

其次对于其二阶导数为:

         技术图片

 

 

之后关于目标函数的包含二阶导数的泰勒展开式为:

         技术图片

这时将技术图片看成技术图片的函数,则根据函数的最小值性质,当偏导数等于0时出取得,从而得到技术图片技术图片,所以技术图片根据等式的特点得到,只有两者都取0时才能使等式等于0,所以得:  

    技术图片(最小值)

     技术图片技术图片 技术图片 技术图片

    技术图片技术图片

 

     技术图片技术图片

故牛顿法的迭代公式为:

       技术图片

 

 

 

2、梯度下降法

在开始推导之前,来介绍一下一个概念:梯度(当前函数位置的导数),同时它也表示某一函数在该点处的方向导数沿着该方向取得较大值。

       梯度:技术图片

 

  之后这里给出一阶泰勒展开式

           技术图片

由于技术图片都是矢量,则技术图片也是矢量,则根据矢量与向量的关系,这时我们可以用一个单位向量V(下一步将要变化的方向)与标量的乘积来表示:技术图片,而技术图片

 

 便是我们所说的步进长度。这时技术图片表达式为:技术图片

 

又由我们的目的出发,所以可以我们希望通过这个迭代变化使技术图片技术图片小,以此达到最小值。所以由公式技术图片,当梯度方向技术图片技术图片成反方向时,能最大程度的朝着局部下降的方向变化,使技术图片取得最大值。根据技术图片技术图片的数学关系,这时可以得出技术图片技术图片的计算关系:技术图片(一般情况,单位向量都是正向的)

    技术图片技术图片

    技术图片(由于是标量,可以把它与步进长度合到一起)

     技术图片

故梯度下降法的迭代公式为:

     技术图片 

 

以上是关于牛顿法与梯度下降法数学公式推导过程的主要内容,如果未能解决你的问题,请参考以下文章

GBDT与xgb区别,以及梯度下降法和牛顿法的数学推导

梯度下降法

对数几率回归法(梯度下降法,随机梯度下降与牛顿法)与线性判别法(LDA)

最小二乘法+牛顿法+拟牛顿法+梯度下降法+梯度上升法+共轭梯度法

梯度下降法与牛顿下降法速度的比较

深入分析:近端梯度下降法交替方向乘子法牛顿法