最优化所需基础知识-第六节1:凸函数前置基础知识

Posted 快乐江湖

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了最优化所需基础知识-第六节1:凸函数前置基础知识相关的知识,希望对你有一定的参考价值。

文章目录

一:梯度

梯度:给定函数 f : R n → R f:\\R^n\\rightarrow \\R f:RnR,且 f f f在点 x x x的一个领域内有意义,若存在向量 g ∈ R n g\\in R^n gRn满足

l i m p → 0 f ( x + p ) − f ( x ) − g T p ∣ ∣ p ∣ ∣ = 0 \\mathoplim \\limits_p\\rightarrow 0\\fracf(x+p)-f(x)-g^Tp||p||=0 p0lim∣∣p∣∣f(x+p)f(x)gTp=0

  • ∣ ∣ . ∣ ∣ ||.|| ∣∣.∣∣是任意的向量范数

就称 f f f x x x可微(Frechet可微)。此时 g g g称为 f f f在点 x x x处的梯度,记作 ∇ f ( x ) \\nabla f(x) f(x)。如果对区域 D D D上每一个点 x x x都有 ∇ f ( x ) \\nabla f(x) f(x)存在,则称 f f f D D D上可微

f f f在点 x x x处的梯度存在,在定义式中令 p = ξ e i p=\\xi e_i p=ξei e i e_i ei是第 i i i个分量为1的单位向量,可知 ∇ f ( x ) \\nabla f(x) f(x)的第 i i i个分量为 ∂ f ( x ) ∂ x i \\frac\\partial f(x)\\partial x_i xif(x),因此

∇ f ( x ) = ( ∂ f ( x ) ∂ x 1 , ∂ f ( x ) ∂ x 2 , . . . , ∂ f ( x ) ∂ x n ) T \\nabla f(x)=(\\frac\\partial f(x)\\partial x_1, \\frac\\partial f(x)\\partial x_2, ...,\\frac\\partial f(x)\\partial x_n)^T f(x)=(x1f(x),x2f(x),...,xnf(x))T

例如 f ( x , y ) = 1 x 2 + y 2 f(x, y)= \\frac1x^2+y^2 f(x,y)=x2+y21,则 ∇ 1 x 2 + y 2 = − 2 x ( x 2 + y 2 ) 2 i − 2 y ( x 2 + y 2 ) 2 j \\nabla \\frac1x^2+y^2= -\\frac2x(x^2+y^2)^2i-\\frac2y(x^2+y^2)^2j x2+y21=(x2+y2)22xi(x2+y2)22yj

二:海瑟矩阵

海瑟矩阵:如果函数 f ( x ) : R n → R f(x):\\R^n\\rightarrow \\R f(x):RnR x x x处的二阶偏导数 ∂ 2 f ( x ) ∂ x i ∂ x j ( i , j = 1 , 2 , . . . , n ) \\frac\\partial^2f(x)\\partial x_i \\partial x_j(i, j=1, 2,...,n) xixj2f(x)(i,j=1,2,...,n)都存在,则 f f f在点 x x x处的海瑟矩阵为

  • ∇ 2 f ( x ) \\nabla^2f(x) 2f(x)在区域 D D D上的每个点 x x x处都存在时,则称 f f f D D D二阶可微
  • ∇ 2 f ( x ) \\nabla^2f(x) 2f(x)在区域 D D D上还连续,则称 f f f D D D二阶连续可微,可以证明此时海瑟矩阵为对称矩阵

三:矩阵变量函数的导数

多元函数梯度的定义可以推广到变量是矩阵的情形。对于以 m × n m×n m×n矩阵 X X X为自变量的函数 f ( X ) f(X) f(X),若存在矩阵 G ∈ R m × n G\\in \\R^m×n GRm×n满足

l i m V → 0 f ( X + V ) − f ( X ) − < G , V > ∣ ∣ V ∣ ∣ = 0 \\mathoplim \\limits_V\\rightarrow 0\\fracf(X+V)-f(X)-<G,V>||V||=0 V0lim∣∣V∣∣f(X+V)f(X)<G,V>=0

  • ∣ ∣ . ∣ ∣ ||.|| ∣∣.∣∣是任意矩阵范数

就称矩阵变量函数 f f

以上是关于最优化所需基础知识-第六节1:凸函数前置基础知识的主要内容,如果未能解决你的问题,请参考以下文章

最优化所需基础知识-第三节:重要凸集举例

最优化所需基础知识-第八节:次梯度

Linux内核第六节 20135332武西垚

CISCO网络基础小实验第六节

Java学习-第一部分-第一阶段-第六节:面向对象编程(基础)

最优化所需基础知识-第二节:凸集