评估和计算 Top-N 准确度:Top 1 和 Top 5

Posted

技术标签:

【中文标题】评估和计算 Top-N 准确度:Top 1 和 Top 5【英文标题】:Evaluation & Calculate Top-N Accuracy: Top 1 and Top 5 【发布时间】:2016-10-06 17:43:28 【问题描述】:

我遇到过几篇关于使用 Top-N 方法评估准确性的(机器学习分类问题)期刊论文。数据显示,在相同的训练、测试条件下,Top 1 准确率 = 42.5%,Top-5 准确率 = 72.5%。 我想知道如何计算top-1 和top-5 的百分比?

有人可以告诉我计算这个的例子和步骤吗?

谢谢

【问题讨论】:

@SalvadorDali 检查以下来自“rcpinto”的答案。也许你也可以从那里理解一些东西。感谢您的回复,下次我会澄清我的问题。 【参考方案1】:

准确率的补码是错误,top-1错误是分类器没有给出正确类最高概率分数的时间百分比。 前 5 个错误:- 分类器在前 5 个概率或猜测中不包括正确类别的时间百分比。

【讨论】:

【参考方案2】:

Top-1 准确度是常规准确度:模型答案(概率最高的那个)必须完全是预期答案。

Top-5 准确度意味着您的模型 5 个最高概率答案中的任何必须与预期答案匹配。

例如,假设您正在使用神经网络将机器学习应用于对象识别。显示了一张猫的图片,这些是您的神经网络的输出:

老虎:0.4 狗:0.3 猫:0.1 猞猁:0.09 狮子:0.08 鸟:0.02 熊:0.01

使用 top-1 准确度,您将此输出视为错误,因为它预测了老虎。

使用前 5 位准确度,您将此输出视为正确,因为 cat 是前 5 位猜测之一。

【讨论】:

感谢您的回答。在您看来,Top-5 真的是一个很好的指标,还是一种夸大神经网络真实能力的方式?如果我是盲人,并让某人告诉我面前是什么动物,我会期待“它是一只猫”而不是“它是老虎、狗、猫、山猫或狮子”。 我认为 top-5 指标很有用,除其他原因外,因为一张图片可以有多个对象... 所以我们可以说top-5的准确率总是高于Top-1的准确率 更高或等于 @JonathonReinhart 可能有点晚了,但大多数大型模型都是在 ImageNet 数据集上训练的,包含 1000 个可能的类,因此实际上推断模型在 Top-5 的表现如何非常现实,因为它缩小了其他 995 个可能的类别。但是,如果您只有 10 个班级,那么 Top-5 就没有用处了。

以上是关于评估和计算 Top-N 准确度:Top 1 和 Top 5的主要内容,如果未能解决你的问题,请参考以下文章

storm RollingTopWords 实时top-N计算任务窗口设计

Oracle子查询相关内容(包含TOP-N查询和分页查询)

top-N 抽样

尽管 STOPKEY 优化,top-N 查询做太多工作

Python:在 List 或 numpy.ndarry 中查找最大的 Top-n 值的索引 [重复]

RS利用局部隐含空间模型进行Top-N推荐