评测指标(metrics)

Posted 2022-08-31 Datawhale

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了评测指标(metrics)相关的知识，希望对你有一定的参考价值。

评测指标(metrics)

metric主要用来评测机器学习模型的好坏程度,不同的任务应该选择不同的评价指标, 分类,回归和排序问题应该选择不同的评价函数. 不同的问题应该不同对待,即使都是分类问题也不应该唯评价函数论,不同问题不同分析.

回归(Regression)

均方误差(MSE)

$\\haty)=\\frac1n\\sum_i=1^n(y_i-\\haty_i)^2 \\tag1$

均方根误差(RMSE)

$\\haty)=\\sqrt\\frac1n\\sum_i=1^n(y_i-\\haty_i)^2 \\tag2$

平均绝对误差(MAE)

$\\haty)=\\frac1n\\sum_i=1^n|y_i-\\haty_i| \\tag3$

R Squared

$R^2=1-\\frac(\\sum_i=1^n(y_i-\\hatyi)^2)/n(\\sumi=1^n(y_i-\\bary_i)^2)/n \\tag4$
其中: $\\haty$ 是预测值, $y$ 是真实值, $n$ 是样本个数, $\\bary$ 是 $y$ 的平均值.

分类(Classification)

准确率和错误率

$acc(y,\\haty)=\\frac1n\\sum_i=1^ny_i=\\haty_i \\tag5$
$\\haty)=1-acc(y,\\haty) \\tag6$

混淆矩阵,精准率和召回率

对于二分类问题,可将样例根据其真是类别与学习器预测类别的组合划分为真正例(true positive, TP),假正例(false positive, FP),真反例(ture negative, TN),假反例(false negative, FN), 则有:TP+FP+TN+FN=样例总数. 分类结果的混淆矩阵(confusion matrix)如下:

则有精准率P和召回率R定义如下: $P=\\fracTPTP+FP \\tag7$
$R=\\fracTPTP+FN \\tag8$
则F1值定义如下: $\\frac1F_1=\\frac12 \\cdot (\\frac1P+\\frac1R) \\tag9$
$F_1=\\frac2PRP+R \\tag10$
以上是关于评测指标(metrics)的主要内容，如果未能解决你的问题，请参考以下文章