模型训练 - 对象的裁剪图像 VS 带有边界框的更大图像

Posted

技术标签:

【中文标题】模型训练 - 对象的裁剪图像 VS 带有边界框的更大图像【英文标题】:Model training - cropped image of the object VS bigger image with bounding box 【发布时间】:2021-11-24 04:30:51 【问题描述】:

我需要训练一个新模型(keras+tensorflow),我在问自己两者之间是否有任何区别

    提供一组仅包含感兴趣对象的图像(从原始图像裁剪) 提供带有对象注释的更大图像(边界框和类的坐标)

我的逻辑告诉我,很可能在内部训练应该只在裁剪的部分上进行,所以从技术上讲应该没有区别。 问候

【问题讨论】:

【参考方案1】:

您描述的两种方法通常称为图像分类(模型只需要对图像进行分类)和object detection(模型需要检测图像中对象的位置并对其进行分类) .有时简单区分为“分类”和“检测”。这两种方法需要不同的技术,并且已经开发了不同的模型来处理每种方法。一般来说,图像分类是一个更简单的问题,您可能已经猜到了。

使用哪种方法取决于您的最终应用。如果您只需要知道“此图像中是否存在对象”,则可以使用分类技术。如果您需要知道“图像中的物体在哪里”或“图像中有多少物体”,那么您应该使用检测技术。

可能不直观的是,对象检测不仅仅是图像分类的扩展,因此如果您需要对象检测,最好从对象检测模型开始,而不是构建图像分类器,然后将其扩展到对象检测. This article 提供了关于这个主题的一些直觉。

【讨论】:

以上是关于模型训练 - 对象的裁剪图像 VS 带有边界框的更大图像的主要内容,如果未能解决你的问题,请参考以下文章

如何裁剪可可数据集以进行预处理?

无法获取带有边界框的谷歌卫星图像

加载图像以进行检测的更有效方式

根据对象边界框裁剪旋转图像 - Matlab

如何使用python google colab将带有边界框的图像存储在文件夹中?

裁剪的边界框不正确