SVM+核函数选择

Posted Data+Science+Insight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SVM+核函数选择相关的知识,希望对你有一定的参考价值。

SVM+核函数选择

See the source image

See the source image

一般用线性核和高斯核,也就是Linear核与RBF核

需要注意的是需要对数据归一化处理,很多使用者忘了这个小细节

然后一般情况下RBF效果是不会差于Linear

但是时间上RBF会耗费更多,其他同学也解释过了.

下面是吴恩达的见解:

1. 如果Feature的数量很大,跟样本数量差不多,这时候选用LR或者是Linear Kernel的SVM;

2. 如果Feature的数量比较小,样本数量一般,不算大也不算小,选用SVM+Gaussian Kernel;

3. 如果Feature的数量比较小,而样本数量很多,需要手工添加一些feature变成第一种情况;

即:

如果特征维数很高,往往线性可分(SVM 解决非线性分类问题的思路就是将样本映射到更高维的特征空间中),可以采用 LR 或者线性核的 SVM;

  • 如果样本数量很多,由于求解最优化问题的时候,目标函数涉及两两样本计算内积,使用高斯核明显计算量会大于线性核,所以手动添加一些特征,使得线性可分,然后可以用 LR 或者线性核的 SVM;
  • 如果不满足上述两

以上是关于SVM+核函数选择的主要内容,如果未能解决你的问题,请参考以下文章

SVM+核函数选择

R语言SVM支持向量机模型数据分类实战:探索性数据分析模型调优特征选择核函数选择

关于核函数的一些思考

支持向量机(SVM):超平面及最大间隔化支持向量机的数学模型软间隔与硬间隔线性可分支持向量机线性支持向量机非线性支持向量机核函数核函数选择SMO算法SVM vs LR优缺点

支持向量机SVM(3)核函数、非线性支持向量机

SVM核函数