如何基于无约束方法建立约束优化方法

Posted 2023-04-28

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了如何基于无约束方法建立约束优化方法相关的知识，希望对你有一定的参考价值。

参考技术A Data Mining 无约束最优化方法梯度的方向与等值面垂直，并且指向函数值提升的方向。二次收敛是指一个算法用于具有正定二次型函数时，在有限步可达到它的极小点。二次收敛与二阶收敛没有尽然联系，更不是一回事，二次收敛往往具有超线性以上的本回答被提问者采纳

无约束优化算法-第一节：线搜索方法

文章目录

一：无约束优化问题概述
二：线搜索方法

一：无约束优化问题概述

考虑如下无约束优化问题

$\\mathopmin\\limits_x\\in R^nf(x)$

无约束优化问题是众多优化问题中最基本的一类问题，它对自变量 $x$ 的取值范围不加限制，所以无需考虑 $x$ 的可行性

对于光滑函数，我们可以较容易地利用梯度和海瑟矩阵的信息来设计算法
对于非光滑函数，我们可以利用次梯度来构造迭代格式

无约束优化问题的优化算法主要分为如下两类

线搜索类型：根据搜索方向的不同可以分为如下几种，一旦确定了搜索的方向，下一步即沿着该方向寻找下一个迭代点
- 梯度类算法
- 次梯度算法
- 牛顿算法
- 拟牛顿算法
- …
信赖域类型：主要针对 $f (x)$ 二阶可微的情形，它是在一个给定的区域内使用二阶模型近似原问题，通过不断直接求解该二阶模型从而找到最优值点

二：线搜索方法

（1）概述

线搜索方法：对于本文最开始的优化问题，采用线搜索方法求解 $f (x)$ 最小值点的过程类似于盲人下山：假设一个人处于某个点 $x$ 处， $f (x)$ 表示此地的高度，为了寻找最低点，在点 $x$ 处需要确定如下两件事情

下一步应该向哪一个方向行走？
沿着该方向行走多远后停下以便选取下一个下山方向

以上这两个因素确定后，便可以一直重复，直到到达 $f (x)$ 的最小值点

线搜索类算法的数学表述为：给定当前迭代点 $x^k$ ，首先通过某种算法选取向量 $d^k$ ，之后确定正数 $\\alpha_k$ ，则下一步迭代点可以写作

$x^k+1=x^k+\\alpha_kd^k$

$d^k$ ：是迭代点 $x^k$ 处的搜索方向。此处要求 $d^k$ 是一个下降方向，也即 $(d^k)^T\\nabla f(x^k)<0$ ，这个下降性质保证了沿着此方向搜索函数值会减小
$\\alpha_k$ ：是相应的步长

所以线搜索类算法的关键是如何选取一个好的方向 $d^k$ 和合适的步长 $\\alpha_k$

不同的线搜索算法对于 $d^k$ 的选取有着不同的方式，但 $\\alpha_k$ 的选取方法却基本一致。首先构造辅助函数

$\\phi(\\alpha)=f(x^k+\\alpha d^k)$

$d^k$ ：是给定的下降方向
$\\alpha >0$ ：是该辅助函数的自变量

函数 $\\phi(\\alpha)$ 的几何意义非常直观：它是目标函数 $f (x)$ 在射线 $\\x^k+\\alpha d^k:\\alpha>0\\$ 上的限制。线搜索的目标时选取合适的 $\\alpha_k$ 使得 $\\phi(\\alpha_k)$ 尽可能小，这要求

$\\alpha_k$ 应该使得 $f$ 充分下降
不应该在寻找 $\\alpha_k$ 上花费过度的计算量

所以一个自然的想法是寻找 $\\alpha_k$ 使得

$\\alpha_k=\\mathopargmin\\limits_\\alpha>0\\phi(\\alpha)$

这种线搜索方法称之为精确线搜索算法，虽然精确线搜索算法可以在多数情况下找到问题的解，但这通常需要非常大的计算量，所以实际应用中很少使用。所以另一个想法是不要求 $\\alpha_k$ 是 $\\phi(\\alpha)$ 的最小值点，而仅仅要求 $\\phi(\\alpha_k)$ 满足某些不等式性质，因此这类方法称之为非精确线搜索算法，所以我们接下来介绍该类算法的结构