22.支持向量机—高斯核函数
Posted WuJiaYFN
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了22.支持向量机—高斯核函数相关的知识,希望对你有一定的参考价值。
主要内容
- 高斯核函数的引入
- 高斯核函数详细介绍
一、高斯核函数的引入
1.1 非线性决策边界问题—常规方法(高级数的多项式模型)
-
对于一个非线性决策边界问题,我们可以使用高级数的多项式模型 来解决无法用直线进行分隔的分类问题:
-
为了获得上图所示的判定边界,我们的模型可能是 θ 0 + θ 1 x 1 + θ 2 x 2 + θ 3 x 1 x 2 + θ 4 x 1 2 + θ 5 x 2 2 + ⋯ \\theta _0+\\theta _1x_1+\\theta _2x_2+\\theta _3x_1x_2+\\theta _4x_1^2+\\theta _5x_2^2+\\cdots θ0+θ1x1+θ2x2+θ3x1x2+θ4x12+θ5x22+⋯ 的形式。
-
我们可以用一系列的新的特征 f f f来替换模型中的每一项。例如令:
f 1 = x 1 , f 2 = x 2 , f 3 = x 1 x 2 , f 4 = x 1 2 , f 5 = x 2 2 f_1=x_1,f_2=x_2,f_3=x_1x_2,f_4=x_1^2,f_5=x_2^2 f1=x1,f2=x2,f3=x1x2,f4=x12,f5=x22得到 h θ ( x ) = θ 1 f 1 + θ 2 f 2 + . . . + θ n f n h_θ(x)=\\theta _1f_1+\\theta _2f_2+...+\\theta _nf_n hθ(x)=θ1f1+θ2f2+...+θnfn。
2.2 非线性决策边界问题—优化方法(高斯核函数)
- 给定一个训练样本 x x x, 利用 x x x 的各个特征与我们预先选定的预先选定的地标(landmarks) l ( 1 ) , l ( 2 ) , l ( 3 ) l^(1),l^(2),l^(3) l(1),l(2),l(3)的近似程度来选取新的特征 f 1 , f 2 , f 3 f_1,f_2,f_3 f1,f2,f3。
-
新特征的得到方法:例如: f 1 = s i m i l a r i t y ( x , l ( 1 ) ) = e ( − ∥ x − l ( 1 ) ∥ 2 2 σ 2 ) f_1=similarity(x,l^(1))=e(-\\frac\\left\\| x-l^(1) \\right\\|^22\\sigma ^2) f1=similarity(x,l(1))=e(−2σ2∥x−l(1)∥2)
-
其中: ∥ x − l ( 1 ) ∥ 2 = ∑ j = 1 n ( x j − l j ( 1 ) ) 2 \\left\\| x-l^(1) \\right\\|^2=\\sum_j=1^n(x_j-l_j^(1))^2 ∥ ∥x−l(1)∥ ∥2=∑j=1n(xj−lj(1))2,为实例 x x x中所有特征与地标 l ( 1 ) l^(1) l(1)之间的距离的和。上例中的 s i m i l a r i t y ( x , l ( 1 ) ) similarity(x,l^(1)) similarity(x,l(1))就是核函数,具体而言,这里是一个高斯核函数(Gaussian Kernel)
-
地标的作用:
-
如果一个训练样本 x x x与地标 l l l之间的距离近似于0,则新特征 f f f近似于** e − 0 = 1 e^-0=1 e−0=1,**
-
如果训练样本 x x x与地标 l l l之间距离较远,则 f f f近似于** e − ( 一个较大的数 ) = 0 e^-(一个较大的数)=0 e−(一个较大的数)=0**
-
-
利用高斯核函数来预测的方法:
-
在上图中,假设我们已经训练好了参数列表为:$θ_0=-0.5 ,θ_1=1,θ_2=1,θ_3=0 $
-
则当样本处于洋红色的点位置处,因为其离 l ( 1 ) l^(1) l(1)更近,但是离 l ( 2
以上是关于22.支持向量机—高斯核函数的主要内容,如果未能解决你的问题,请参考以下文章
-