22.支持向量机—高斯核函数

Posted WuJiaYFN

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了22.支持向量机—高斯核函数相关的知识,希望对你有一定的参考价值。

主要内容

  1. 高斯核函数的引入
  2. 高斯核函数详细介绍

一、高斯核函数的引入

1.1 非线性决策边界问题—常规方法(高级数的多项式模型)

  • 对于一个非线性决策边界问题,我们可以使用高级数的多项式模型 来解决无法用直线进行分隔的分类问题:

  • 为了获得上图所示的判定边界,我们的模型可能是 θ 0 + θ 1 x 1 + θ 2 x 2 + θ 3 x 1 x 2 + θ 4 x 1 2 + θ 5 x 2 2 + ⋯ \\theta _0+\\theta _1x_1+\\theta _2x_2+\\theta _3x_1x_2+\\theta _4x_1^2+\\theta _5x_2^2+\\cdots θ0+θ1x1+θ2x2+θ3x1x2+θ4x12+θ5x22+ 的形式。

  • 我们可以用一系列的新的特征 f f f来替换模型中的每一项。例如令:
    f 1 = x 1 , f 2 = x 2 , f 3 = x 1 x 2 , f 4 = x 1 2 , f 5 = x 2 2 f_1=x_1,f_2=x_2,f_3=x_1x_2,f_4=x_1^2,f_5=x_2^2 f1=x1,f2=x2,f3=x1x2,f4=x12,f5=x22得到 h θ ( x ) = θ 1 f 1 + θ 2 f 2 + . . . + θ n f n h_θ(x)=\\theta _1f_1+\\theta _2f_2+...+\\theta _nf_n hθ(x)=θ1f1+θ2f2+...+θnfn

2.2 非线性决策边界问题—优化方法(高斯核函数)

  • 给定一个训练样本 x x x, 利用 x x x 的各个特征与我们预先选定的预先选定的地标(landmarks) l ( 1 ) , l ( 2 ) , l ( 3 ) l^(1),l^(2),l^(3) l(1),l(2),l(3)的近似程度来选取新的特征 f 1 , f 2 , f 3 f_1,f_2,f_3 f1,f2,f3

  • 新特征的得到方法:例如: f 1 = s i m i l a r i t y ( x , l ( 1 ) ) = e ( − ∥ x − l ( 1 ) ∥ 2 2 σ 2 ) f_1=similarity(x,l^(1))=e(-\\frac\\left\\| x-l^(1) \\right\\|^22\\sigma ^2) f1=similarity(x,l(1))=e(2σ2xl(1)2)

  • 其中: ∥ x − l ( 1 ) ∥ 2 = ∑ j = 1 n ( x j − l j ( 1 ) ) 2 \\left\\| x-l^(1) \\right\\|^2=\\sum_j=1^n(x_j-l_j^(1))^2 xl(1) 2=j=1n(xjlj(1))2,为实例 x x x中所有特征与地标 l ( 1 ) l^(1) l(1)之间的距离的和。上例中的 s i m i l a r i t y ( x , l ( 1 ) ) similarity(x,l^(1)) similarity(x,l(1))就是核函数,具体而言,这里是一个高斯核函数(Gaussian Kernel)

  • 地标的作用:

    • 如果一个训练样本 x x x与地标 l l l之间的距离近似于0,则新特征 f f f近似于** e − 0 = 1 e^-0=1 e0=1,**

    • 如果训练样本 x x x与地标 l l l之间距离较远,则 f f f近似于** e − ( 一个较大的数 ) = 0 e^-(一个较大的数)=0 e(一个较大的数)=0**

  • 利用高斯核函数来预测的方法: