scikit-learn 中使用标准 MAE 而不是 MSE 的随机森林回归慢约 150 倍 [重复]

Posted

技术标签:

【中文标题】scikit-learn 中使用标准 MAE 而不是 MSE 的随机森林回归慢约 150 倍 [重复]【英文标题】:Random Forest Regression in scikit-learn with criterion MAE instead of MSE is ~150 times slower [duplicate] 【发布时间】:2020-10-18 14:26:21 【问题描述】:

我正在尝试使用带有criterion = mae(平均绝对误差)而不是mse(均方误差)的随机森林回归。

它对计算时间有非常重要的影响。

大约需要 6 分钟mae)而不是 2.5 秒mse)。大约慢了 150 倍。

为什么?

可以做些什么来减少计算时间?

附:类似的情况也发生在决策树上。 差别不大,但每棵树的配给量大致相同。

【问题讨论】:

【参考方案1】:

这是一个众所周知的问题。请参阅here 和here。

长话短说:

使用mae,更新损失需要O(n); 使用mse,更新损失需要O(1)

【讨论】:

以上是关于scikit-learn 中使用标准 MAE 而不是 MSE 的随机森林回归慢约 150 倍 [重复]的主要内容,如果未能解决你的问题,请参考以下文章

[机器学习与scikit-learn-28]:算法-回归-评估指标详解

DecisionTreeRegressor MAE 使用均值而不是中值?

深度学习-回归问题的评估指标:MAE, MAPE, MSE, RMSE, R2_Score

scikit-learn 中的负平均绝对误差是多少?

使用 Scikit-learn (sklearn) 估算整个 DataFrame(所有列)而不迭代列

随机森林回归 MAE