第12篇Sparse R-CNN: End-to-End Object Detection with Learnable Proposals

Posted 2021-10-11 AI浩

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了第12篇Sparse R-CNN: End-to-End Object Detection with Learnable Proposals相关的知识，希望对你有一定的参考价值。

Sparse R-CNN: End-to-End Object Detection with Learnable Proposals

论文地址：https://arxiv.org/abs/2011.12450

摘要

我们提出了 Sparse R-CNN，这是一种用于图像中对象检测的纯稀疏方法。现有的对象检测工作严重依赖于密集的候选对象，例如在大小为 H × W 的图像特征图的所有网格上预定义的 k 个锚框。然而，在我们的方法中，向对象识别头提供一组固定的稀疏学习对象提议，总长度为 N，以执行分类和定位。通过将 HW k（多达数十万）个手工设计的候选对象消除到 N 个（例如 100 个）可学习的建议，Sparse R-CNN 完全避免了与候选对象设计和多对一标签分配相关的所有努力。更重要的是，最终预测是直接输出的，没有非最大抑制后处理。稀疏 R-CNN 在具有挑战性的 COCO 数据集上展示了与完善的检测器基线相当的准确性、运行时间和训练收敛性能，例如，在标准 3× 训练计划中实现 45.0 AP 并使用 ResNet-50 FPN 模型以 22 fps 运行。我们希望我们的工作能够激发重新思考对象检测器中密集先验的惯例。代码位于：https://github.com/PeizeSun/SparseR-CNN。

以上是关于第12篇Sparse R-CNN: End-to-End Object Detection with Learnable Proposals的主要内容，如果未能解决你的问题，请参考以下文章