线性可分支持向量机与软间隔最大化--SVM

Posted hichens

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了线性可分支持向量机与软间隔最大化--SVM相关的知识,希望对你有一定的参考价值。

线性可分支持向量机与软间隔最大化--SVM


给定线性可分的数据集

假设输入空间(特征向量)为技术图片,输出空间为技术图片
输入技术图片
表示实例的特征向量,对应于输入空间的点;
输出技术图片
表示示例的类别。

我们说可以通过间隔最大化或者等价的求出相应的凸二次规划问题得到的分离超平面
技术图片
以及决策函数:
技术图片
但是,上述的解决方法对于下面的数据却不是很友好, 例如,下图中黄色的点不满足间隔大于等于1的条件

技术图片

这样的数据集不是线性可分的, 但是去除少量的异常点之后,剩下的点都是线性可分的, 因此, 我们称这样的数据集是近似线性可分的
对于近似线性可分的数据集,我们引入了松弛变量技术图片,使得函数间隔加上松弛变量大于等于1。这样就得到了下面的解决方案:

技术图片

其中,每个样本点都对应一个松弛变量, C > 0 称为惩罚参数。C越大,对误分类的点的惩罚越大。
这个解决方案旨在使得间隔最大化的同时减少误分类个数。下图是C对分类的影响,左图是大C, 右图是小C:

技术图片

可以证明w是唯一的, 但是b不唯一,而是存在一个区间


下面来解决这个问题

首先引入拉格朗日函数(Lagrange Function):

技术图片

他的对偶问题(参考拉格朗日对偶性(Lagrange duality))是极大极小问题技术图片, 首先求技术图片。对技术图片求导,解法如下:

技术图片

代入得到:
技术图片

问题转化为:

技术图片

怎么求最优的w, b呢?
我们来看,原问题的KKT条件如下:
技术图片

根据KKT条件的性质可以知道(参考拉格朗日乘子(Lagrange multify)和KKT条件):

技术图片

所以可以求得技术图片

技术图片


综上, 引入松弛变量后线性支持向量机算法为:

.

技术图片



以上是关于线性可分支持向量机与软间隔最大化--SVM的主要内容,如果未能解决你的问题,请参考以下文章

线性可分支持向量机与软间隔最大化

支持向量机原理线性不可分支持向量机与核函数

支持向量机原理线性不可分支持向量机与核函数

李航统计学习方法(第二版)(十三):线性可分支持向量机与硬间隔最大化

机器学习二十:线性不可分支持向量机与核函数

11支持向量机SVM:线性可分支持向量机