支持向量机-- 核函数
Posted gccbuaa
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了支持向量机-- 核函数相关的知识,希望对你有一定的参考价值。
一、核函数的引入
问题1:
SVM显然是线性分类器。但数据假设根本就线性不可分怎么办?
解决方式1:
数据在原始空间(称为输入空间)线性不可分。可是映射到高维空间(称为特征空间)后非常可能就线性可分了。
问题2:
映射到高维空间同一时候带来一个问题:在高维空间上求解一个带约束的优化问题显然比在低维空间上计算量要大得多,这就是所谓的“维数灾难”。
解决方式2:
于是就引入了“核函数”。核函数的价值在于它尽管也是讲特征进行从低维到高维的转换。
二、实例说明
比如图中的两类数据,分别分布为两个圆圈的形状,不论是不论什么高级的分类器,仅仅要它是线性的。就没法处理。SVM 也不行。
由于这种数据本身就是线性不可分的。
从上图我们能够看出一个理想的分界应该是一个“圆圈”而不是一条线(超平面)。
假设用
注意上面的形式,假设我们构造另外一个五维的空间,当中五个坐标的值分别为
关于新的坐标
也就是说,假设我们做一个映射
还记得之前我们用内积这里是二维模型,可是如今我们须要三维或者更高的维度来表示样本。这里我们如果是维度是三。
那么首先须要将特征x扩展到三维,然后寻找特征和结果之间的模型。我们将这样的特征变换称作特征映射(feature mapping)。映射函数称作,在这个样例中
我们希望将得到的特征映射后的特征应用于SVM分类,而不是最初的特征。
为什么须要映射后的特征而不是最初的特征来參与计算,一个重要原因是例子可能存在线性不可分的情况,而将特征映射到高维空间后,往往就可分了。
将核函数形式化定义。假设原始特征内积是,映射后为以上是关于支持向量机-- 核函数的主要内容,如果未能解决你的问题,请参考以下文章
支持向量机(SVM):超平面及最大间隔化支持向量机的数学模型软间隔与硬间隔线性可分支持向量机线性支持向量机非线性支持向量机核函数核函数选择SMO算法SVM vs LR优缺点