Python 上的 SVM：特征选择之后

Posted 2023-03-12

技术标签:

【中文标题】Python 上的 SVM：特征选择之后【英文标题】：SVM on Python: After feature selection 【发布时间】：2018-04-12 14:29:47 【问题描述】：

我正在研究一个具有约 80 个特征的数据集。运行特征选择程序后，我想在 Python 上使用 svm.SVC 关注 8 个选择的特征。

我想知道svm.SVC的输入是否应该是只有经过特征选择后这8个特征的数据。（或者在SVM这一步之前还有什么其他的程序需要申请吗？）

【问题讨论】：

当然，您会选择用于机器学习算法的特征（以免被太多数据淹没），因此只有这 8 个特征应该提供给 SVM。并且您可能需要在 SVM 步骤之前对特征值进行规范化或标准化。如果有的话，对数据中的 NaN 值做一些事情。 @CrazyElf 谢谢！是的，将应用标准化等。 【参考方案1】：

您应该始终在运行 SVM 之前扩展您的数据。我会以Speed of SVM Kernels? Linear vs RBF vs Poly 为例说明为什么需要在运行 SVM 之前扩展数据。否则，在构建模型之前，您不一定需要做任何其他事情。

【讨论】：

以上是关于Python 上的 SVM：特征选择之后的主要内容，如果未能解决你的问题，请参考以下文章