机器学习中,有哪些特征选择的工程方法?

Posted Data+Science+Insight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习中,有哪些特征选择的工程方法?相关的知识,希望对你有一定的参考价值。

机器学习中,有哪些特征选择的工程方法?

数据和特征决定了机器学习的上限,而模型和算法调参只是逼近这个上限而已。

0,特征本身是否具有基础的表征能力或者判别性,例如方差筛选法。方差是衡量一个变量的离散程度(即数据偏离平均值的程度大小),变量的方差越大,就可以认为它的离散程度越大,也就是意味着这个变量对模型的贡献和作用会更明显,因此要保留方差较大的变量,反之,要剔除掉无意义的特征。方差大的变量更有可能产生对目标变量的差异判别。


1.计算每一个特征与响应变量的相关性(例如依次做特征与目标变量的t检验、曼惠特尼检验、方差分析等):工程上常用的手段有计算皮尔逊系数和互信息系数,得到相关性之后就可以排序选择特征了࿱

以上是关于机器学习中,有哪些特征选择的工程方法?的主要内容,如果未能解决你的问题,请参考以下文章

机器学习实战基础(十七):sklearn中的数据预处理和特征工程特征选择 之 Embedded嵌入法

机器学习实战基础(十七):sklearn中的数据预处理和特征工程特征选择 之 Embedded嵌入法

一文介绍机器学习中的三种特征选择方法

机器学习面试题

特征工程中数据预处理方法总结

机器学习sklearn(十六): 特征工程特征选择卡方选择卡方检验