机器学习——08特征选择
Posted lcj170
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习——08特征选择相关的知识,希望对你有一定的参考价值。
用过滤法对以下数据进行特征选择:
[[0,2,0,3],
[0,1,4,3],
[0,1,1,3]]
要求:
1、Variance Threshold(threshold =1.0)
2、将结果截图放上来(没有条件的备注说明原因)注意:每个人的电脑ID是不一样的
特征选择的原因:
①冗余:部分特征的相关度搞,容易消耗计算性能
②噪音:部分特征对预测结果有影响。
这里的特征选择就是降低维度,即选择最合适的特征数量,过滤式筛选指标是方差大小。
步骤:①初始化variance threshold,指定阈值方差。②调用fit_transform。
源代码:
#过滤式特征选择 from sklearn.feature_selection import VarianceThreshold def var(): #特征选择-删除低方差的特征 var=VarianceThreshold(threshold=1.0) #初始化variance threshold,指定阈值方差 data=var.fit_transform([[0,2,0,3],[0,1,4,3],[0,1,1,3]]) #调用fit_transform print(data) return None if __name__ == "__main__": var();
图1 阈值方差为1的结果
图2 阈值方差为0的结果
以上是关于机器学习——08特征选择的主要内容,如果未能解决你的问题,请参考以下文章
[机器学习与scikit-learn-45]:特征工程-特征选择(降维)-1-哈希向量
[机器学习与scikit-learn-50]:特征工程-特征选择(降维)-5-二级过滤-特征值与标签之间的关系:F过滤与互信息量法过滤