算法模型的评估

Posted rr-99

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了算法模型的评估相关的知识,希望对你有一定的参考价值。

一般对于算法模型的评估量有很多,常用到的是精确率和真正率(召回率)以及ROC曲线和PR曲线,之前也有提到,今天查找了一些资料对着四个评估量进行一个小总结。

  1、首先是对一些概念的理解

TP  真正  是指预测为正样本,实际也是正样本的特征数

FP  假正  是预测为为正样本,实际为负样本的特征数

TN  真负 是预测为为负样本,实际也是负样本的特征数

FN  假正  是预测为负样本,实际为正样本的特征数

  2、公式

真正率=TP/(TP+FN)     正确的被判断正的概率

准确率=TP/(TP+FP)     预测为正的样本中,实际为正的概率

负正率=FP/(FP+TN)

真负率=TN/(TN+FP)=1-真正率  错误的预测为负的概率  

  3、ROC曲线PR曲线

ROC曲线是以负正率为X轴,以真正率为Y轴得到的曲线,当真正率越高,负正率越低,这个模型或者算法就更有效。在图上显示的位曲线越靠近左上方效果越好,即曲线下方的面积越大,模型越好。

PR曲线是以真正率为X轴,以准确率为Y轴得到的曲线,当准确率越高,真正率越高,其模型和算法越有效。在图上显示为曲线越靠近右上方越好,即曲线下方面积越大,模型越好。

 

以上是关于算法模型的评估的主要内容,如果未能解决你的问题,请参考以下文章

算法模型的评估

聚类算法模型评估

sklearn使用投票回归VotingRegressor算法构建多模型融合的投票回归模型并自定义子回归器的权重(weights)评估多模型融合的回归模型评估R2msermsemape

隐马尔科夫模型HMM前向后向算法评估观察序列概率

R语言数据分析/商业报告/人力资源绩效评估模型/关联规则数据挖掘/随机森林模型算法预测陈金文老师手把手教学

机器学习基础——模型参数评估与选择