sklearn 度量单位的准确性,平均绝对误差,回归问题的均方误差?

Posted

技术标签:

【中文标题】sklearn 度量单位的准确性,平均绝对误差,回归问题的均方误差?【英文标题】:sklearn metrics units of Measurement of accuracy, mean absolut error, mean squared error for regression problems? 【发布时间】:2020-06-22 23:01:52 【问题描述】:

哪个度量单位具有 sklearn 指标的准确度、平均绝对误差和均方误差?它们是否用于回归问题? 例如,我的 regressor.score(X_test,y_test)) 约为 0.99469。那么测试模型与真实数据相比是 0.99469?还是你说 99% 的百分比? MAE 和 MSE 也是如此。

另一个问题是,关于分类问题的混淆矩阵,准确率是从混淆矩阵中计算出来的值。我使用多元线性回归,那么我可以将这些指标用于我的回归吗?

【问题讨论】:

【参考方案1】:

要回答您的第一个问题,准确度等指标不能用于回归问题。是的,你是对的。准确率是使用混淆矩阵计算的,但由于您有回归问题,因此无法获得混淆矩阵,因为它是分类问题的输出,但您有回归问题。

此外,回归问题的正确度量是均方误差、平均绝对误差和 R 平方值。默认情况下,regressor.score(X_test,y_test)) 函数会给出 R 平方值。

为方便起见,该值越接近 1(在您的情况下为 0.99469),您的模型就越好。而且看起来您的模型表现得非常好。

【讨论】:

【参考方案2】:

通常,metrics.mean_absolute_error(y_true, y_pred)metrics.mean_squared_error(y_true, y_pred) 会为您提供相应的指标。

regressor.score(X_test, y_test) 实际上是metrics.r2_score,它是 R^2 值,即可以解释为模型解释的方差量。在您的情况下,您会说数据中 99.469% 的变化是由您的模型解释的(对于训练数据)。

检查:https://scikit-learn.org/stable/modules/model_evaluation.html#regression-metrics

和http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html

传统上,混淆矩阵不用于回归问题,但还有其他方法可以评估您的 mlr 模型,所有(sklearn)都在上面链接

【讨论】:

以上是关于sklearn 度量单位的准确性,平均绝对误差,回归问题的均方误差?的主要内容,如果未能解决你的问题,请参考以下文章

机器学习1-关于回归问题的准确性评价

如何获得深度学习模型的平均绝对误差 (MAE)

评价分类与预测算法的指标

分类预测算法评价(初识)

为啥我得到高 MAE(平均绝对误差)和 MSE(均方误差)与 MAPE(平均绝对百分比误差)相比?

随机森林中每棵树的平均绝对误差