西瓜书习题3.2

Posted forcekeng

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了西瓜书习题3.2相关的知识,希望对你有一定的参考价值。

题目描述

试证明,对于参数 (omega),对率回归的目标函数(3.18)是非凸的,但其对数似然函数(3.27)是凸的。

证明方法

凸函数的二阶条件,如果(f(x))是凸函数的充要条件

[ abla ^2 f(x) succeq 0 ]

对定义域内所有(x)成立,且(f(x)) 定义域为凸集。参见 Boyd 的Convex Optimization 的3.1.4节。
这里还用到对向量的求导。

证明

(3.18)式如下:

[y = frac{1}{1+ e^{-w^Tx + b}} ]

证明:

[suppose: g = g(w) = e^{-w^Tx + b} g‘ = -gx \ f(w) = frac{1}{1+ g} abla f(w) = frac{g}{(1+ g)^2} x\nabla^2f(w) = frac {g‘(1+g)^2 - g*2*(1+g)g‘ } {(1+g)^4} x= frac{g‘(1-g^2)}{(1+g)^4}x = -frac{g(1-g^2)}{(1+g)^4}x x^T \]

注意这里的变量是 (w) 而不是(x),如果取 (x)为一维且大于(0),取合适的(w)使得(g(w)<1),则可得 ( abla ^2 f(x) succeq 0) 不成立。所以(3.18)式不是关于(w)的凸函数。

(3.27)如下

[l(eta) = sum_{i=1}^m (-y_ieta ^T x_i + ln(1+e^{eta^T x_i})) ]

证明:

[suppose: g_i = g_i(eta) = e^{eta^T x_i} g_i > 0 g_i‘ = g_i x_i \nabla l(eta) = sum_{i=1}^m (-y_i x_i + frac{g_i‘}{1+g_i}) = sum_{i=1}^m (-y_i x_i + frac{g_i}{1+g_i}x_i) \nabla^2 l(eta) = sum_{i=1}^m frac{g_i‘(1+g_i) - g_i g_i‘}{(1+g_i)^2}x_i = sum_{i=1}^m frac{g_i}{(1+g_i)^2}x_i x_i^T\]

其中 (x_i x_i^T) 之前的系数为正实数, (x_i)是一个样本,即是 (n) 维列向量,如果证明矩阵 (x_i x_i^T) 是半正定的,则 ( abla^2 l(eta)) 就是多个半正定矩阵的非负加权和,则也是半正定矩阵,即满足 ( abla^2 l(eta) succeq 0)
一个矩阵 (Ain R^{n imes n}) 是半正定的,则对任意的 (y) , 有 (y^TAy ge 0)
任取 (y in R^n) ,则

[y^T(x_i x_i^T)y = (y^T x_i)(x_i^Ty) = (x_i^Ty)^T (x_i^Ty) ge 0 ]

所以矩阵 (x_i x_i^T) 是半正定的。证毕!

以上是关于西瓜书习题3.2的主要内容,如果未能解决你的问题,请参考以下文章

西瓜书课后习题——第六章

西瓜书第1章习题

《机器学习》 西瓜书习题 第 2 章

《机器学习》西瓜书习题 第 4 章

西瓜书课后习题——第一章

西瓜书课后习题练习——Ch3.3编程实现对率回归