为啥物体检测 CNN 的边界框必须与图像边界平行?
Posted
技术标签:
【中文标题】为啥物体检测 CNN 的边界框必须与图像边界平行?【英文标题】:Why does the bounding box of an object detection CNN has to be parallel to the image borders?为什么物体检测 CNN 的边界框必须与图像边界平行? 【发布时间】:2018-06-03 23:26:58 【问题描述】:查看利用深度学习进行对象识别的最新进展,例如MASK-RCNN 或YOLO,我注意到对象的边界框始终与图像边界平行。
这仅仅是由于提供的训练数据的符号,例如 COCO,还是由于底层架构。看看 Yolo 或 RCNN 的最后一层 - 是否可以在像图像中的对象一样旋转的矩形上进行训练?
【问题讨论】:
【参考方案1】:这些模型通常预测 x 和 y 的中心点,以及宽度和高度。这就解释了一致的结果。如果训练数据提供了另一种形式的标签,那么应该也可以轻松学习其他边界框。
【讨论】:
在 YOLO 的情况下不正确,已经尝试过了。以上是关于为啥物体检测 CNN 的边界框必须与图像边界平行?的主要内容,如果未能解决你的问题,请参考以下文章