线性不可分SVM 软间隔
Posted Zetaa
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了线性不可分SVM 软间隔相关的知识,希望对你有一定的参考价值。
前言:仅个人小记。参看https://blog.csdn.net/qq_25847123/article/details/108058804。
线性不可分
大部分样本线性可分,总体线性不可分。
引入松弛变量
某些样本点不能满足函数间隔大于等于
1
1
1 这个约束条件,软间隔策略就是对每个样本点引入一个松弛变量
ξ
≥
0
\\xi\\geq 0
ξ≥0。是的函数间隔加上松弛变量是大于等于
1
1
1 的。此时,之前硬间隔最大化中的约束条件更变为
y
i
(
w
⋅
x
i
+
b
)
≥
1
−
ξ
i
y_i(\\boldsymbolw\\cdot \\boldsymbolx_i+b)\\geq 1\\colorred-\\xi_i
yi(w⋅xi+b)≥1−ξi
同时,对每个松弛变量
ξ
i
\\xi_i
ξi 支付一个代价
ξ
i
\\xi_i
ξi。目标函数更变为
1
2
∣
∣
w
∣
∣
2
+
C
∑
i
=
1
N
ξ
i
\\frac12||w||^2\\colorred+C\\sum_i=1^N\\xi_i
21∣∣w∣∣2+Ci=1∑Nξi
C C C 成为惩罚参数,取决于实际的应用场景。 C C C 值越大,则对误分类的惩罚越大, C C C 值越小,对误分类的惩罚越小。现在,最小化目标函数意味着:1) 使得 1 2 ∣ ∣ w ∣ ∣ 2 \\frac12||w||^2 21∣∣w∣∣2 尽量小即间隔尽量大,同时使误分类点的个数尽量小, C C C 是调和二者的系数。
线性不可分SVM的凸二次规划
线性不可分的线性支持向量机的学习问题更变为如下凸二次规划问题(原始问题):
max
w
,
b
1
2
∣
∣
w
∣
∣
2
+
C
∑
i
=
1
N
ξ
i
s
.
t
.
y
i
(
w
x
i
+
b
)
≥
1
−
ξ
i
,
i
=
[
1
,
N
]
ξ
i
≥
0
,
i
=
1
,
2
,
.
.
.
,
N
\\begingathered\\max_\\boldsymbolw,b\\frac12||w||^2+\\colorredC\\sum_i=1^N\\xi_i\\\\ \\mathsfs.t. y_i(\\boldsymbolw\\boldsymbolx_i+b)\\geq 1\\colorred-\\xi_i,i=[1,N]\\\\ \\colorred\\xi_i\\geq 0,i=1,2,...,N \\endgathered
w,bmax21∣∣w∣∣2+Ci=1∑Nξis.t.yi(wxi+b)≥1−ξi,i=[1,N]ξi≥0,i=1,2,...,N
可以证明 , w \\boldsymbolw w的解是唯一的,而 b b b可能不唯一,而是存在于一个区间(实际应用中,往往可以直接求出来)。
线性支持向量机的对偶形式
min α 1 2 ∑ i = 1 N ∑ i = 1 N α i α j y i y j ( x i x j ) − ∑ i = 1 N α i s . t . ∑ i = 1 N α i y i = 1 0 ≤ α i ≤ C , i = 1 , 2 , . . . , N \\begingathered\\min_\\alpha\\frac12\\sum_i=1^N\\sum_i=1^N\\alpha_i\\alpha_jy_iy_j(\\boldsymbolx_i\\boldsymbolx_j)-\\sum_i=1^N\\alpha_i\\\\ \\mathsfs.t. \\sum_i=1^N \\alpha_iy_i=1\\\\ 0\\leq \\alpha_i\\colorred\\leq C, i =1,2,...,N \\endgathered αmin21i=1∑Ni=1∑Nαiαjyiyj(xixj)−i=1∑Nαis.t.i=1∑Nαiyi=10≤αi≤C,i=1,2,...,N
进一步得到原问题的解,
w
∗
=
∑
i
=
1
N
α
i
∗
y
i
x
i
b
∗
=
y
j
−
∑
i
=
1
N
α
i
∗
y
i
(
x
i
x
j
)
\\begingathered w^*=\\sum_i=1^N\\alpha_i^*y_i\\boldsymbolx_i\\\\ b^* = y_j-\\sum_i=1^N \\alpha_i^*y_i(\\boldsymbolx_i\\boldsymbolx_j) \\endgathered
w∗=i=1∑Nαi∗yixib∗=yj−i=1∑Nαi∗yi(xixj)
其中,
j
j
j是对应一个
α
∗
\\alpha^*
α线性不可分SVM 软间隔