最优分离超平面目标函数混淆

Posted

技术标签:

【中文标题】最优分离超平面目标函数混淆【英文标题】:optimal separating hyperplane objective function confusion 【发布时间】:2016-10-07 22:50:08 【问题描述】:

Chapter 4.5.2 of Elements of Statistical Learning

不明白什么意思:

"由于任何满足这些不等式的β和β0,任何正标度 多重也满足,我们可以任意设置||β|| = 1/M.”​

另外,最大化 M 是如何变成最小化 1/2(||β||^2) 的?

【问题讨论】:

【参考方案1】:

"由于任何满足这些不等式的β和β0,任何正标度倍数也满足它们,我们可以任意设置||β|| = 1/M.”​

y_i(x_i' b + b0) >= M ||b||

因此对于任何 c>0

y_i(x_i' [bc] + [b0c]) >= M ||bc||

因此你总能找到这样的 c 满足 ||bc|| = 1/M,所以我们可以只关注 b 使得它们具有这样的范数(我们只是限制了可能解决方案的空间,因为我们知道缩放变化不大)

另外,最大化 M 是如何变成最小化 1/2(||β||^2) 的?

我们把 ||b|| = 1/M,因此 M=1/||b||

max_b M = max_b 1 / ||b||

现在 f(b) 的最大化等效于 1/f(b) 的最小化,所以

min ||b||

因为||b||为正,它的最小化就相当于平方最小化,以及乘以1/2(这不会改变最优b)

min 1/2 ||b||^2  

【讨论】:

以上是关于最优分离超平面目标函数混淆的主要内容,如果未能解决你的问题,请参考以下文章

支持向量机(SVM)

最优化所需基础知识-第五节:分离超平面定理

林轩田SVM

最优化知识笔记整理汇总

SVM算法总结

机器学习之支持向量机原理和sklearn实践