将分类变量转换为伪变量后,如何从sklearn api中找到功能的重要性?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了将分类变量转换为伪变量后,如何从sklearn api中找到功能的重要性?相关的知识,希望对你有一定的参考价值。

在将分类变量转换为虚拟变量以训练模型之后。我们倾向于发现功能的重要性。但是sklearn的model.feature_importance_对象为每个虚拟变量(而不是原始分类变量)返回特征点。如何解决?

答案

因为使用伪变量来训练模型,所以无法找到原始分类变量的重要性。这在数学上是不可能的事情。

以上是关于将分类变量转换为伪变量后,如何从sklearn api中找到功能的重要性?的主要内容,如果未能解决你的问题,请参考以下文章

使用 sklearn 同时使用数字和分类变量来拟合决策树

在 sklearn 中使用 DictVectorizer 后如何获得分类特征的重要性

SKLearn:标签编码分类值的虚拟变量

sklearn 树在拆分期间将分类变量视为浮点数,我应该如何解决这个问题?

如何在 sklearn 中使用 OneHotEncoder 的输出?

处理多元线性回归Python中的分类和数值变量