模型的度量

Posted xuehuiping

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了模型的度量相关的知识,希望对你有一定的参考价值。

参考《机器学习》,周志华,清华大学出版社

第二章

回归问题

回归任务常用的度量指标是:均方误差

[ E(f;D)=frac {1}{m}sum^{m}_{i=1}(f(x_{i})-y_{i})^{2} ]

分类问题

分类任务中常用的性能度量指标是:错误率、精度

错误率:分类错误的样本数/样本总数

精度:分类正确的样本数/样本总数

预测结果
真实情况 正例 反例
正例 TP 真正例 FN 假反例
反例 FP 假正例 TN 真反例

查准率precision:

[ P=frac {TP}{TP+FP} ]

查全率recall:

[ R=frac {TP}{TP+FN} ]

P-R曲线

以查准率为横轴,以查全率为纵轴,得到查准率、查全率曲线,简称“P-R”曲线。
技术图片

平衡点

查全率 = 查准率

F1

[ F1 = frac {2 imes P imes R } {P+R} ]

真正例率:

[ TPR = frac {TP}{TP+FN} ]

假正例率:

[ FPR = frac {FP} {TN+FP} ]

ROC曲线

研究学习器的泛化能力

横轴假正例率,纵轴真正例率,得到ROC曲线
技术图片

AUC

ROC曲线下的面积,称为AUC
技术图片

以上是关于模型的度量的主要内容,如果未能解决你的问题,请参考以下文章

机器学习:模型性能度量(performance measure)(待补充)

基于结构的距离度量

模型评估(度量)

使用分数度量评估高斯混合模型?

回归模型几个度量参数概念比较

维度模型数据仓库基础对象概念一览