支持向量机(理论篇)
Posted 蟹先森爱学习
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了支持向量机(理论篇)相关的知识,希望对你有一定的参考价值。
今天介绍传说中的支持向量机(Support VectorMachine,SVM),SVM是在1995年首次被Vapnik和Cortes提出的。支持向量机简称为SVM,是机器学习的一个重要分支,简单的来说,支持向量机是一种简单的二类分类模型,一般是1和-1两种类别。
SVM的基本模型可以认为是待分类的样本空间中的间隔最大的线性分类器,或者称为分类超平面。SVM的具体学习策略是使得分类超平面和样本的间隔最大化,这样一来,复杂的分类问题就可以最终可转化为一个凸的二次规划问题,该问题易于求解,已经有许多成熟的解法。解决该凸而次规划问题相当于解决复杂的分类问题。
SVM的核心思想其实就是找到一个分类超平面,利用该超平面将待分类的样本进行分离,从而达到分类效果。SVM已经经过详细而严谨的理论证明,具有很强的理论性,而且大量的实验结果已经验证了该理论的正确性。
接下来我们简要推导一下,首先关我们看下分类样本和分类超平面的示意图
图中gamma就是几何间隔,对于分类超平面,样本 x可以表示为:
因此,要使得分类效果好就需要使得每个点离分类超平面尽可能远,也就是间隔尽可能大,假设分类超平面的表达式为y = wx + b,则上述描述可以转为表达式
进一步可以简化为:
上式等价于:
引入Lagrange乘子,上式转化为:
根据Lagrange对偶性原理:
对L求偏导得
反带入上式得
问题进一步转化为:
这种优化问题是传统意义上的优化问题,可以使用传统的方法解决,得到最优的alpha ,再根据下式
可以求得最优的w和b,从而可以确定最优的分类超平面以及分类决策函数。这是支持向量机的核心部分。
今天推出我们的LOGO,以后就用它了。
以上是关于支持向量机(理论篇)的主要内容,如果未能解决你的问题,请参考以下文章