每个班级应该有多少张图像(最少)来训练 YOLO?

Posted

技术标签:

【中文标题】每个班级应该有多少张图像(最少)来训练 YOLO?【英文标题】:How many images(minimum) should be there in each classes for training YOLO? 【发布时间】:2019-08-16 19:50:16 【问题描述】:

我正在尝试在我的自定义数据集上实现 YOLOv2。每个班级需要最少的图片数量吗?

【问题讨论】:

【参考方案1】:

每个班级的训练图像数量没有限制。当然你的数字越小,模型收敛速度越慢,准确率也会低。

根据 Alexey(流行的分叉暗网和 YOLO v4 的创建者)的说法,重要的是如何改进对象检测:

对于您要检测的每个对象 - 必须至少有 1 个 训练数据集中的相似对象,大致相同:形状, 物体的侧面、相对尺寸、旋转角度、倾斜度、照明度。 如此理想,以至于您的训练数据集包含带有对象的图像 不同的:从不同的侧面,缩放,旋转,灯光 不同的背景 - 你最好有 2000 不同的 每个类或更多类的图像,你应该训练 2000*classes 迭代或更多

https://github.com/AlexeyAB/darknet

因此,如果您想获得最佳准确度,我认为每个班级至少应该有 2000 张图像。但是每班1000也不错。即使每个班级有数百张图像,您仍然可以获得不错的(不是最佳的)结果。尽可能多地收集图像。

【讨论】:

当你说每类 2000 张图像时,你是指 2000 个边界框吗?如果我在 300 个图像中标记 2000 个对象(单个图像中的多个标签)可以吗?所以我每个班级只有 300 张图片。 他的意思是整个训练集中每个班级有 2000 个边界框。我的图像集每张图像有大约 60-70 个对象,并且只有 200 个图像,我实现了 99% 的“准确度”。【参考方案2】:

视情况而定。

每个班级至少有一张图片。原则上,如果使用数据增强策略并微调预训练的 YOLO 网络,这可能会有一定的准确性。

然而,客观现实是,每个班级可能需要多达 1000 张图片,具体取决于您的问题。

【讨论】:

以上是关于每个班级应该有多少张图像(最少)来训练 YOLO?的主要内容,如果未能解决你的问题,请参考以下文章

训练精度提高但验证精度仍然是每个班级的机会(1/班级数)

TensorFlow:如何测量每个张量占用多少 GPU 内存?

跑yolo3需要多少显存

宠物食品的图像分类模型

[数据集][VOC][目标检测]输电线异物数据集目标检测可用yolo训练-4165张介绍

[数据集][VOC][目标检测]河道垃圾水面漂浮物数据集目标检测可用yolo训练-1304张介绍