徒手推导 “支持向量机”

Posted PHPer进击之路

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了徒手推导 “支持向量机”相关的知识,希望对你有一定的参考价值。

0. 前言

本文只讲述支持向量机(svm)的基础,不涉及任何高深东西。

1. 支持向量机的作用

先看一图:

我们第一直觉就是在两堆点中间画一根线,分开两类点。

徒手推导 “支持向量机”

2. 如何判断好坏

下面问题来了,能够区分两堆点的线有好多,怎么区分哪个好?

这就引出了街宽 (margin) 的概念:

徒手推导 “支持向量机”

上面两条曲线,我们可以用下面的两个公式表达:

徒手推导 “支持向量机”

此处我们为什么选择常数 1?因为如果假设是常数 k,我们总可以通过两边同时除以 k,对 w 和 b 进行缩放,让等式右边变为 1.

上面两个式子可以统一为:

徒手推导 “支持向量机”

下面我们来计算街宽:

徒手推导 “支持向量机”

我们通过下面公式来计算街宽。

徒手推导 “支持向量机”

3. 优化街宽

我们现在知道街宽只和 w 相关,下面是我们的优化目标:

此时所有 (x,y) 满足:

徒手推导 “支持向量机”

4. 最优解

总结下目前的优化目标:

徒手推导 “支持向量机”

我们通过拉格朗日可以将其转换为下面的求极值问题:

徒手推导 “支持向量机”

徒手推导 “支持向量机”

推导到这里,我们可以通过一些数学的工具包解出来。

当我们求出后,我么就能将 w,b 带回原来的式子,得到:

徒手推导 “支持向量机”

5. 支持向量

支持向量机中中一个很重要的概念就是支持向量,让我们来看上面推导中的式子:

徒手推导 “支持向量机”

上面红色部分,对于那些不在 “站街” 上的点,其值肯定是大于 0 的,因此为了取得最大值,最好的方式就是让,因此我们在判断式子中,只需要计算的那些和新加入点 x 的点积即可。

徒手推导 “支持向量机”

一个形象说明:

徒手推导 “支持向量机”

6. 核函数

线性空间到非线性空间变化,从而使得数据线性可分:

徒手推导 “支持向量机”

徒手推导 “支持向量机”

核函数的意义在于:我们不需要知道具体的映射函数是什么 [由于太复杂我们也求不出],我们只需要知道在新的空间中两个点之间的点乘形式即可。

7. 离群点处理

在前面的讨论中我们都假设数据是线性可分的,对于在原空间中不可分的点,我们通过核函数变化,也能在新空间中进行区分,但是由于噪声存在的原因,总会有些点偏离正常的点,我们称之为离群点,下面我们来定义下处理离群点的方案:

徒手推导 “支持向量机”

即在每个点的街宽上强制的留点余地:

徒手推导 “支持向量机”

加上余地有优化目标变为:

然后通过和上面一样的方法,我么能最终转换为下面的问题:

和之前的结果对比一下,可以看到唯一的区别就在每个 α 多了一个上限 C 。

8. 总结

本文介绍了支持向量机的作用,一步一步推导了支持向量机的求解过程了,接着给出了 “支持向量” 的概念,最后介绍了核方法和离群点处理方法来解决非线性可分数据的分类问题。

9. 参考

支持向量机系列

你的鼓励是我继续写下去的动力,期待我们共同进步。

以上是关于徒手推导 “支持向量机”的主要内容,如果未能解决你的问题,请参考以下文章

支持向量机(SVM)的原理推导及解释

机器学习之支持向量机:支持向量机的公式推导

支持向量机(SVM)之数学公式详细推导

机器学习之四:支持向量机推导

支持向量机(SVM)的详细推导过程及注解

从零推导支持向量机 (SVM)