基于模型(Model-based)进行特征选择(feature selection)并可视化特征重要性(feature importance)
Posted Data+Science+Insight
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于模型(Model-based)进行特征选择(feature selection)并可视化特征重要性(feature importance)相关的知识,希望对你有一定的参考价值。
基于模型(Model-based)进行特征选择(feature selection)并可视化特征重要性(feature importance)
sklean 中的 SelectFromModel进行特征选择的基础是特征重要程度、即特种重要性。
# 加载sklearn自带的糖尿病(diabetes)数据集并输出数据集的说明信息,进行数据的理解
一共有422个样本,10个特征:
数据集包含、年龄、性别、BMI指标、血压、T细胞指标、低密度脂蛋白、高密度脂蛋白、甲状腺素、拉莫三嗪、血糖值;
其中血糖值是回归的目标;
from sklearn.datasets import load_diabetes
diabetes = load_diabetes()
X, y = diabetes.data, diabetes.target
print(diabetes.DESCR)
.. _diabetes_dataset: Diabetes dataset ---------------- Ten baseline variables, age, sex, body mass index, average blood pressure, and six blood serum measurements were obtained for each of n = 442 diabetes patients, as well as the response of interest, a quantitative measure of disease progression one year after baseline. **Data Set Characteristics:** :Number of Instances: 442 :Number of Attri
以上是关于基于模型(Model-based)进行特征选择(feature selection)并可视化特征重要性(feature importance)的主要内容,如果未能解决你的问题,请参考以下文章
基于模型设计(Model-Based Design)方法在物联网中的应用
R语言基于模拟退火(Simulated Annealing)进行特征筛选(feature selection)
R语言基于遗传算法(Genetic Algorithm)进行特征筛选(feature selection)