是否有与 H2o 的“stopping_rounds”类似的 SKLearn RFClassifier 参数?

Posted

技术标签:

【中文标题】是否有与 H2o 的“stopping_rounds”类似的 SKLearn RFClassifier 参数?【英文标题】:Is there a comparable SKLearn RFClassifier argument to H2o's 'stopping_rounds'? 【发布时间】:2020-02-06 03:46:49 【问题描述】:

我正在将使用 h20 和 r 的随机森林转换为使用 SciKit Learn 的随机森林分类器和 python 的随机森林。 H2o 的 randomForest 模型有一个参数“stopping_rounds”。有没有办法在 python 中使用 SKLearn 随机森林分类器模型来做到这一点?我已经查看了文档,所以恐怕我必须硬编码。

【问题讨论】:

【参考方案1】:

不,我不相信 scikit-learn 算法有任何类型的自动提前停止机制(这就是 stopping_rounds 在 H2O 算法中所涉及的)。您将不得不手动计算出最佳的树数。

【讨论】:

【参考方案2】:

根据sklearn random forest classifier docs,提前停止由min_impurity_split(已弃用)和min_impurity_decrease 参数确定。它似乎没有与 H2O 相同的功能,但它可能正是您想要的。

【讨论】:

以上是关于是否有与 H2o 的“stopping_rounds”类似的 SKLearn RFClassifier 参数?的主要内容,如果未能解决你的问题,请参考以下文章

H2O 是不是支持一类分类?

是否可以在 H2O Driverless 中定义最终模型使用多少变量

H2O.ai MOJO 依赖项

在 H2O 随机森林和 xgboost 中使用权重列

用 H2O 流量预测概率

是否有与 Haskell 'let' 等效的 Python