模型训练 - 对象的裁剪图像 VS 带有边界框的更大图像
Posted
技术标签:
【中文标题】模型训练 - 对象的裁剪图像 VS 带有边界框的更大图像【英文标题】:Model training - cropped image of the object VS bigger image with bounding box 【发布时间】:2021-11-24 04:30:51 【问题描述】:我需要训练一个新模型(keras+tensorflow),我在问自己两者之间是否有任何区别
-
提供一组仅包含感兴趣对象的图像(从原始图像裁剪)
提供带有对象注释的更大图像(边界框和类的坐标)
我的逻辑告诉我,很可能在内部训练应该只在裁剪的部分上进行,所以从技术上讲应该没有区别。 问候
【问题讨论】:
【参考方案1】:您描述的两种方法通常称为图像分类(模型只需要对图像进行分类)和object detection(模型需要检测图像中对象的位置并对其进行分类) .有时简单区分为“分类”和“检测”。这两种方法需要不同的技术,并且已经开发了不同的模型来处理每种方法。一般来说,图像分类是一个更简单的问题,您可能已经猜到了。
使用哪种方法取决于您的最终应用。如果您只需要知道“此图像中是否存在对象”,则可以使用分类技术。如果您需要知道“图像中的物体在哪里”或“图像中有多少物体”,那么您应该使用检测技术。
可能不直观的是,对象检测不仅仅是图像分类的扩展,因此如果您需要对象检测,最好从对象检测模型开始,而不是构建图像分类器,然后将其扩展到对象检测. This article 提供了关于这个主题的一些直觉。
【讨论】:
以上是关于模型训练 - 对象的裁剪图像 VS 带有边界框的更大图像的主要内容,如果未能解决你的问题,请参考以下文章