scikit-learn 中使用标准 MAE 而不是 MSE 的随机森林回归慢约 150 倍 [重复]
Posted
技术标签:
【中文标题】scikit-learn 中使用标准 MAE 而不是 MSE 的随机森林回归慢约 150 倍 [重复]【英文标题】:Random Forest Regression in scikit-learn with criterion MAE instead of MSE is ~150 times slower [duplicate] 【发布时间】:2020-10-18 14:26:21 【问题描述】:我正在尝试使用带有criterion = mae
(平均绝对误差)而不是mse
(均方误差)的随机森林回归。
它对计算时间有非常重要的影响。
大约需要 6 分钟(mae
)而不是 2.5 秒(mse
)。大约慢了 150 倍。
为什么?
可以做些什么来减少计算时间?
附:类似的情况也发生在决策树上。 差别不大,但每棵树的配给量大致相同。
【问题讨论】:
【参考方案1】:这是一个众所周知的问题。请参阅here 和here。
长话短说:
使用mae
,更新损失需要O(n)
;
使用mse
,更新损失需要O(1)
。
【讨论】:
以上是关于scikit-learn 中使用标准 MAE 而不是 MSE 的随机森林回归慢约 150 倍 [重复]的主要内容,如果未能解决你的问题,请参考以下文章
[机器学习与scikit-learn-28]:算法-回归-评估指标详解
DecisionTreeRegressor MAE 使用均值而不是中值?
深度学习-回归问题的评估指标:MAE, MAPE, MSE, RMSE, R2_Score