最优化方法：拉格朗日乘数法

Posted 2020-11-06 花月世界

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了最优化方法：拉格朗日乘数法相关的知识，希望对你有一定的参考价值。

https://blog.csdn.net/pipisorry/article/details/52135854

https://blog.csdn.net/yujianmin1990/article/details/48494607

解决约束优化问题——拉格朗日乘数法

拉格朗日乘数法（Lagrange Multiplier Method）应用广泛，可以学习麻省理工学院的在线数学课程。

拉格朗日乘数法的基本思想

　　作为一种优化算法，拉格朗日乘子法主要用于解决约束优化问题，它的基本思想就是通过引入拉格朗日乘子来将含有n个变量和k个约束条件的约束优化问题转化为含有（n+k）个变量的无约束优化问题。拉格朗日乘子背后的数学意义是其为约束方程梯度线性组合中每个向量的系数。

　　如何将一个含有n个变量和k个约束条件的约束优化问题转化为含有（n+k）个变量的无约束优化问题？拉格朗日乘数法从数学意义入手，通过引入拉格朗日乘子建立极值条件，对n个变量分别求偏导对应了n个方程，然后加上k个约束条件（对应k个拉格朗日乘子）一起构成包含了（n+k）变量的（n+k）个方程的方程组问题，这样就能根据求方程组的方法对其进行求解。

　　解决的问题模型为约束优化问题：

　　min/max a function f(x,y,z), where x,y,z are not independent and g(x,y,z)=0.

　　即：min/max f(x,y,z)

　　　　s.t. g(x,y,z)=0

数学实例

　　首先，我们先以麻省理工学院数学课程的一个实例来作为介绍拉格朗日乘数法的引子。

　　【麻省理工学院数学课程实例】求双曲线xy=3上离远点最近的点。

　　解：

　　首先，我们根据问题的描述来提炼出问题对应的数学模型，即：

　　min f(x,y)=x2+y2（两点之间的欧氏距离应该还要进行开方，但是这并不影响最终的结果，所以进行了简化，去掉了平方）

　　s.t. xy=3.

　　根据上式我们可以知道这是一个典型的约束优化问题，其实我们在解这个问题时最简单的解法就是通过约束条件将其中的一个变量用另外一个变量进行替换，然后代入优化的函数就可以求出极值。我们在这里为了引出拉格朗日乘数法，所以我们采用拉格朗日乘数法的思想进行求解。

　　我们将x2+y2=c的曲线族画出来，如下图所示，当曲线族中的圆与xy=3曲线进行相切时，切点到原点的距离最短。也就是说，当f(x,y)=c的等高线和双曲线g(x,y)相切时，我们可以得到上述优化问题的一个极值（注意：如果不进一步计算，在这里我们并不知道是极大值还是极小值）。

　　现在原问题可以转化为求当f(x,y)和g(x,y)相切时，x,y的值是多少？

　　如果两个曲线相切，那么它们的切线相同，即法向量是相互平行的，▽f//▽g.

　　由▽f//▽g可以得到，▽f=λ*▽g。

　　这时，我们将原有的约束优化问题转化为了一种对偶的无约束的优化问题，如下所示：

　　原问题：min f(x,y)=x2+y2 对偶问题：由▽f=λ*▽g得，

　　　　　　s.t. xy=3 fx=λ*gx，

　　 fy=λ*gy，

xy=3.

约束优化问题无约束方程组问题

　　通过求解右边的方程组我们可以获取原问题的解，即

　　2x=λ*y

　　2y=λ*x

　　xy=3

　　通过求解上式可得，λ=2或者是-2；当λ=2时，(x,y)=(sqrt(3), sqrt(3))或者(-sqrt(3), -sqrt(3))，而当λ=-2时，无解。所以原问题的解为(x,y)=(sqrt(3), sqrt(3))或者(-sqrt(3), -sqrt(3))。

　　通过举上述这个简单的例子就是为了体会拉格朗日乘数法的思想，即通过引入拉格朗日乘子(λ)将原来的约束优化问题转化为无约束的方程组问题。

皮皮blog

拉格朗日乘数法的基本形态

　　求函数在满足下的条件极值，可以转化为函数的无条件极值问题。

　　我们可以画图来辅助思考。

　　绿线标出的是约束g(x,y)=c的点的轨迹。蓝线是f(x,y)的等高线。箭头表示斜率，和等高线的法线平行。

　　从图上可以直观地看到在最优解处，f和g的斜率平行。

　　▽[f(x,y)+λ(g(x,y)−1)]=0, λ≠0

　　一旦求出λ的值，将其套入下式，易求在无约束极值和极值所对应的点。

　　F(x,y)=f(x,y)+λ(g(x,y)−c)

　　新方程F(x,y)在达到极值时与f(x,y)相等，因为F(x,y)达到极值时g(x,y)−c总等于零。

　　上述式子取得极小值时其导数为0，即▽f(x)+▽∑λigi(x)=0，也就是说f(x)和g(x)的梯度共线。

　　题目1：

　　给定椭球

　　求这个椭球的内接长方体的最大体积。这个问题实际上就是条件极值问题，即在条件

　　下，求的最大值。

　　当然这个问题实际可以先根据条件消去，然后带入转化为无条件极值问题来处理。但是有时候这样做很困难，甚至是做不到的，这时候就需要用拉格朗日乘数法了。通过拉格朗日乘数法将问题转化为

　　对求偏导得到

　　联立前面三个方程得到和，带入第四个方程解之

　　带入解得最大体积为

　　拉格朗日乘数法对一般多元函数在多个附加条件下的条件极值问题也适用。

　　题目2：

　　题目：求离散分布的最大熵。

　　分析：因为离散分布的熵表示如下

而约束条件为

要求函数的最大值，根据拉格朗日乘数法，设

对所有的求偏导数，得到

计算出这个等式的微分，得到

这说明所有的都相等，最终解得

因此，使用均匀分布可得到最大熵的值。

皮皮blog

拉格朗日乘数法与KKT条件

拉格朗日乘数法

　　对于第二种形式，带约束条件的问题，我们更倾向于将其转化为无约束问题。在数学最优化问题中，拉格朗日乘数法是一种寻找变量受一个或多个条件所限制的多元函数的极值的方法。这种方法将一个有n 个变量与k 个约束条件的最优化问题转换为一个有n + k个变量的方程组的极值问题，其变量不受任何约束。这种方法引入了一种新的标量未知数，即拉格朗日乘数（：约束方程的梯度（gradient）的线性组合里每个向量的系数，搞不懂这句话在说神马）。
　　上面这段话读起来挺绕的，还是举个例子吧。
　　目标是求 $f (x, y) = x^{2} * y$

　　上图中， $f (x, y)$

对逻辑回归里惩罚的解释

　　现在回过头来看，线性回归目标函数里面的惩罚，是怎么个情况，明白了没？结果发现还是没能够解释为什么要加惩罚 $\frac{1}{2} w^{T} w$