sklearn 度量单位的准确性,平均绝对误差,回归问题的均方误差?
Posted
技术标签:
【中文标题】sklearn 度量单位的准确性,平均绝对误差,回归问题的均方误差?【英文标题】:sklearn metrics units of Measurement of accuracy, mean absolut error, mean squared error for regression problems? 【发布时间】:2020-06-22 23:01:52 【问题描述】:哪个度量单位具有 sklearn 指标的准确度、平均绝对误差和均方误差?它们是否用于回归问题? 例如,我的 regressor.score(X_test,y_test)) 约为 0.99469。那么测试模型与真实数据相比是 0.99469?还是你说 99% 的百分比? MAE 和 MSE 也是如此。
另一个问题是,关于分类问题的混淆矩阵,准确率是从混淆矩阵中计算出来的值。我使用多元线性回归,那么我可以将这些指标用于我的回归吗?
【问题讨论】:
【参考方案1】:要回答您的第一个问题,准确度等指标不能用于回归问题。是的,你是对的。准确率是使用混淆矩阵计算的,但由于您有回归问题,因此无法获得混淆矩阵,因为它是分类问题的输出,但您有回归问题。
此外,回归问题的正确度量是均方误差、平均绝对误差和 R 平方值。默认情况下,regressor.score(X_test,y_test)) 函数会给出 R 平方值。
为方便起见,该值越接近 1(在您的情况下为 0.99469),您的模型就越好。而且看起来您的模型表现得非常好。
【讨论】:
【参考方案2】:通常,metrics.mean_absolute_error(y_true, y_pred)
和 metrics.mean_squared_error(y_true, y_pred)
会为您提供相应的指标。
regressor.score(X_test, y_test)
实际上是metrics.r2_score
,它是 R^2 值,即可以解释为模型解释的方差量。在您的情况下,您会说数据中 99.469% 的变化是由您的模型解释的(对于训练数据)。
检查:https://scikit-learn.org/stable/modules/model_evaluation.html#regression-metrics
和http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html
传统上,混淆矩阵不用于回归问题,但还有其他方法可以评估您的 mlr 模型,所有(sklearn
)都在上面链接
【讨论】:
以上是关于sklearn 度量单位的准确性,平均绝对误差,回归问题的均方误差?的主要内容,如果未能解决你的问题,请参考以下文章