Python 上的 SVM:特征选择之后

Posted

技术标签:

【中文标题】Python 上的 SVM:特征选择之后【英文标题】:SVM on Python: After feature selection 【发布时间】:2018-04-12 14:29:47 【问题描述】:

我正在研究一个具有约 80 个特征的数据集。运行特征选择程序后,我想在 Python 上使用 svm.SVC 关注 8 个选择的特征。

我想知道svm.SVC的输入是否应该是只有经过特征选择后这8个特征的数据。 (或者在SVM这一步之前还有什么其他的程序需要申请吗?)

【问题讨论】:

当然,您会选择用于机器学习算法的特征(以免被太多数据淹没),因此只有这 8 个特征应该提供给 SVM。并且您可能需要在 SVM 步骤之前对特征值进行规范化或标准化。如果有的话,对数据中的 NaN 值做一些事情。 @CrazyElf 谢谢!是的,将应用标准化等。 【参考方案1】:

您应该始终在运行 SVM 之前扩展您的数据。我会以Speed of SVM Kernels? Linear vs RBF vs Poly 为例说明为什么需要在运行 SVM 之前扩展数据。否则,在构建模型之前,您不一定需要做任何其他事情。

【讨论】:

以上是关于Python 上的 SVM:特征选择之后的主要内容,如果未能解决你的问题,请参考以下文章

自动选择最佳特征进行分类-SVM (HALOCN)

R语言SVM支持向量机模型数据分类实战:探索性数据分析模型调优特征选择核函数选择

网格搜索 SVM-anova 的超参数并在 Sklearn 中获得选择的特征

如何使用 SVM 的权重向量和逻辑回归进行特征重要性?

R中的支持向量机特征选择示例

我用PCA做特征降维后svm分类效果不好,为什么