计算机视觉:如何创建合适的边界框

Posted

技术标签:

【中文标题】计算机视觉:如何创建合适的边界框【英文标题】:Computer vision: how to create proper bounding boxes 【发布时间】:2021-07-16 00:38:13 【问题描述】:

我正在创建一个数据集来训练 Yolov5 模型以识别表格数据。我想澄清边界框最佳实践。以下两张图片中边界框紧密度的差异会影响模型的mAP吗?

有点紧的边界框:

紧密的边界框:

原图:

由于创建更紧密的盒子需要更多时间,我想检查是否值得付出额外的努力。

【问题讨论】:

请张贴原图。 @AnnZen 发表了原创文章。这是一个截图 好的,谢谢!不过不确定我能不能帮你。 【参考方案1】:

精确而紧密的边界框始终有助于集中注意力并学习特定于感兴趣对象的更多相关特征。在这种情况下,紧密的边界框注释将在以下方面有所帮助:

学习基于文本边缘的对象边界框并忽略背景特征,这也有助于减少边界框与附近文本行的重叠。 带注释的边界框也将使模型学习文本行空间形状特征(宽度、高度)

查看此链接以了解对象检测注释的最佳实践https://nanonets.github.io/tutorials-page/docs/annotate

【讨论】:

以上是关于计算机视觉:如何创建合适的边界框的主要内容,如果未能解决你的问题,请参考以下文章

将边界框旋转给定角度

传统计算机视觉技术落伍了吗?

使用平台通道/CoreML 在实时摄像机预览的每一帧上运行计算机视觉模型?

深度学习和目标检测系列教程 22-300:关于人体姿态常见的估计方法

深度学习和目标检测系列教程 22-300:关于人体姿态常见的估计方法

计算机视觉与深度学习线性分类器