Python 上的 SVM:特征选择之后
Posted
技术标签:
【中文标题】Python 上的 SVM:特征选择之后【英文标题】:SVM on Python: After feature selection 【发布时间】:2018-04-12 14:29:47 【问题描述】:我正在研究一个具有约 80 个特征的数据集。运行特征选择程序后,我想在 Python 上使用 svm.SVC
关注 8 个选择的特征。
我想知道svm.SVC
的输入是否应该是只有经过特征选择后这8个特征的数据。 (或者在SVM
这一步之前还有什么其他的程序需要申请吗?)
【问题讨论】:
当然,您会选择用于机器学习算法的特征(以免被太多数据淹没),因此只有这 8 个特征应该提供给 SVM。并且您可能需要在 SVM 步骤之前对特征值进行规范化或标准化。如果有的话,对数据中的 NaN 值做一些事情。 @CrazyElf 谢谢!是的,将应用标准化等。 【参考方案1】:您应该始终在运行 SVM 之前扩展您的数据。我会以Speed of SVM Kernels? Linear vs RBF vs Poly 为例说明为什么需要在运行 SVM 之前扩展数据。否则,在构建模型之前,您不一定需要做任何其他事情。
【讨论】:
以上是关于Python 上的 SVM:特征选择之后的主要内容,如果未能解决你的问题,请参考以下文章
R语言SVM支持向量机模型数据分类实战:探索性数据分析模型调优特征选择核函数选择