为啥物体检测 CNN 的边界框必须与图像边界平行?

Posted

技术标签:

【中文标题】为啥物体检测 CNN 的边界框必须与图像边界平行?【英文标题】:Why does the bounding box of an object detection CNN has to be parallel to the image borders?为什么物体检测 CNN 的边界框必须与图像边界平行? 【发布时间】:2018-06-03 23:26:58 【问题描述】:

查看利用深度学习进行对象识别的最新进展,例如MASK-RCNN 或YOLO,我注意到对象的边界框始终与图像边界平行。

这仅仅是由于提供的训练数据的符号,例如 COCO,还是由于底层架构。看看 Yolo 或 RCNN 的最后一层 - 是否可以在像图像中的对象一样旋转的矩形上进行训练?

【问题讨论】:

【参考方案1】:

这些模型通常预测 x 和 y 的中心点,以及宽度和高度。这就解释了一致的结果。如果训练数据提供了另一种形式的标签,那么应该也可以轻松学习其他边界框。

【讨论】:

在 YOLO 的情况下不正确,已经尝试过了。

以上是关于为啥物体检测 CNN 的边界框必须与图像边界平行?的主要内容,如果未能解决你的问题,请参考以下文章

AABB和OBB包围盒简介

从周围的边界框中提取车牌平行四边形?

opencv-python:为啥检测到不正确的边界框(几个边界框)?

YOLO物体检测中如何获取边界框的坐标?

计算边界框重叠的百分比,用于图像检测器评估

yolo算法是指啥?