机器学习中的特征选择filter
Posted bai2018
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习中的特征选择filter相关的知识,希望对你有一定的参考价值。
来源地址:https://www.cnblogs.com/bjwu/p/9103002.html
Filter-移除低均方差的特征
代码:
from sklearn.feature_selection import VarianceThreshold X = [[0, 0, 1], [0, 1, 0], [1, 0, 0], [0, 1, 1], [0, 1, 0], [0, 1, 1]] sel = VarianceThreshold(threshold=(0.2) sel.fit_transform(X)
返回值过滤了方差小于0.2的特征,均方差信息为:
Filter-单变量特征选择
SelectKBest
移除那些除了评分最高的 K 个特征之外的所有特征
代码:
from sklearn.datasets import load_iris from sklearn.feature_selection import SelectKBest from sklearn.feature_selection import chi2 iris = load_iris() X, y = iris.data, iris.target X.shape X_new = SelectKBest(chi2, k=2).fit_transform(X, y) X_new.shape
wrapper-递归式特征消除(RFE)
embedded-选取特征
以上是关于机器学习中的特征选择filter的主要内容,如果未能解决你的问题,请参考以下文章
机器学习实战基础(十六):sklearn中的数据预处理和特征工程特征选择 之 Filter过滤法 总结
机器学习实战基础(十五):sklearn中的数据预处理和特征工程特征选择 之 Filter过滤法 相关性过滤