测量随机森林回归器中每个预测器特征重要性对目标值的影响(量化)(目标值的提升或下降)

Posted

技术标签:

【中文标题】测量随机森林回归器中每个预测器特征重要性对目标值的影响(量化)(目标值的提升或下降)【英文标题】:Measure effect (Quantify) of each predictor feature importance from random forest regressor on the target value (lift or drop in number on target) 【发布时间】:2021-05-15 21:23:33 【问题描述】:

如果我有随机森林回归模型的重要性结果,我如何衡量目标值的提升或下降。基本上是在研究如何量化特征对目标变化的重要性。

例如,我使用随机森林回归器根据 Feature1、Feature2 和 Feature3 预测销售值。我从模型的准确度(MAPE)和 Feature1、Feature2 和 Feature3 的单个特征重要性方面得到了结果。

如何知道将 Feature1 增加 10 个单位会导致我的销售额增加/减少 x 个单位的重要性。

【问题讨论】:

【参考方案1】:
    准备好模型后。然后你可以用它来预测。作为输入,您可以介绍您想要评估的任何内容。 也许您想看看其他类似方向的作品。我相信这可能是对模型的解释。这也是在 python 中实现的一个:https://github.com/slundberg/shap

【讨论】:

以上是关于测量随机森林回归器中每个预测器特征重要性对目标值的影响(量化)(目标值的提升或下降)的主要内容,如果未能解决你的问题,请参考以下文章

随机森林回归进行特征重要性排序时,如何同时得知特征x与预测量y之间是正相关还是负相关?

防止随机森林回归器中数据泄漏的建议

PySpark 和 MLLib:随机森林特征的重要性

利用随机森林对特征重要性进行评估

Python对中国电信消费者特征预测:随机森林朴素贝叶斯神经网络最近邻分类逻辑回归支持向量回归(SVR)

R中回归森林的特征选择和预测精度