Focal Loss for Dense Object Detection 的译读笔记

Posted 2022-12-01 songyuc

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Focal Loss for Dense Object Detection 的译读笔记相关的知识，希望对你有一定的参考价值。

Focal Loss for Dense Object Detection

摘要

目前（注：该论文是在2018年发表于arxiv），精度最高的检测器是基于RCNN推广的两阶段方法，其中分类器会对一组稀疏的候选目标位置进行处理。相对而言，一阶段检测器对可能的目标位置进行常规密集采样并处理，于是具有更快更简单的潜力，但目前来说其精度落后于两阶检测器。本文研究了出现这种情况的原因，发现在密集检测器训练中极度的前背景类别不均衡是主要原因。本文提出重构标准交叉熵损失使得降低分配给易分类样本的损失值。本文创新的 Focal Loss 将训练聚焦于一组稀疏的难样本上，并防止大量简单的负样本在训练期间混淆了检测器。为了评估本文损失函数的有效性，本文设计和训练了一种简单的密集检测器称为RetinaNet。本文的结果显示当使用 Focal Loss 训练时，RetinaNet在同等速度下精度可以超过之前所有的先进的 two-stage 检测器。代码位于https://github.com/facebookresearch/Detectron。

1. 引言

目前的SOTA目标检测器都是基于 two-stage 和 proposal-driven 的框架。正如RCC框架[11_RCNN]中提出的，第一阶段生成一组稀疏后弦目标位置，然后第二阶段使用CNN将每个候选位置分类为前景或背景类别。通过一系列改进[10_FastRCNN, 28_FasterRCNN, 20_AFPN, 14_Mask R-CNN]，这种两阶段框架在富有挑战性的COCO基准测试[21_COCO]上始终保持最高的精度。

以上是关于Focal Loss for Dense Object Detection 的译读笔记的主要内容，如果未能解决你的问题，请参考以下文章