[人工智能-深度学习-70]:数据集 - 目标检测常见公开数据集之MS COCO

Posted 文火冰糖的硅基工坊

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[人工智能-深度学习-70]:数据集 - 目标检测常见公开数据集之MS COCO相关的知识,希望对你有一定的参考价值。

作者主页(文火冰糖的硅基工坊):文火冰糖(王文兵)的博客_文火冰糖的硅基工坊_CSDN博客

本文网址:https://blog.csdn.net/HiWangWenBing/article/details/122174503


目录

第1章 MS COCO概述

1.1 概述

1.2 数据集分类

第2章 与PASCAL VOC数据集比较

2.1 COCO数据集的特点

2.2 COCO与VOC目标数量比较

2.3 更进一步的比较

2.4 每张图片上的类别数量或者实例数量的分布

第3章 MS COCO数据集的文件组织

第4章 MS COCO数据的标签文件的格式: JASON


第1章 MS COCO概述

 1.1 概述

MS COCO (Microsoft COCO: Common Objects in Context) .

MSCOCO数据集是微软开发维护的大型图像数据集,其主要任务包括:目标检测(detection)、目标识别(recognition),目标分割(segementation)。

1.2 数据集分类

COCO数据集是一个大型的、丰富的物体检测,分割和字幕数据集。

这个数据集以scene understanding为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的segmentation进行位置的标定。

图像包括91类目标,328,000影像和2,500,000个label。

目前为止有语义分割的最大数据集,提供的类别有80 类,有超过33 万张图片,其中20 万张有标注,整个数据集中个体的数目超过150 万个。

MS COCO数据集包含很多的分支,
 

第2章 与PASCAL VOC数据集比较

2.1 COCO数据集的特点

与VOC数据集相比,COCO中的图片:(1)包含了自然图片以及生活中常见的目标图片,(2)背景比较复杂,(3)目标数量比较多,(4)目标尺寸更小,(5)因此COCO数据集上的任务更难。

对于检测任务来说,现在衡量一个模型好坏的标准更加倾向于使用COCO数据集上的检测结果。

2.2 COCO与VOC目标数量比较

从比较结果来看:

(1) coco的类别,远远多由于VOC

(2)相同的类别,coco图片的数量也大于VOC图片的数量(instance)

2.3 更进一步的比较

  • PASCAL VOC:20分类。
  • MS COCO     :91分类,接近100分类。
  • ImageNet       :>10000分类。

2.4 每张图片上的类别数量或者实例数量的分布

  • PASCAL和ImageNet中,每张图片上的类别或者实例数量普遍都很少。

    以PASCAL为例:有多于70%的图片上都只有一个类别,而多于50%的图片上只有一个实例或者目标。PASCAL数据集平均每张图片包含1.4个类别和2.3个实例目标,ImageNet也仅有1.7和3.0个。

  • COCO数据集平均每张图片包含 3.5个类别和 7.7 个实例目标,仅有不到20%的图片只包含一个类别,仅有10%的图片包含一个实例目标。

  • COCO数据集不仅数据量大,种类和实例数量也多。从这角度来说 SUN 数据集这两个指标更高一点,但是这个数据集在目标检测里面并不常用。

第3章 MS COCO数据集的文件组织

第4章 MS COCO数据的标签文件的格式: JASON

COCO通过大量使用Amazon Mechanical Turk来收集数据。

COCO数据集现在有3种标注类型:object instances(目标实例), object keypoints(目标上的关键点), and image captions(看图说话),使用JSON文件存储。每种类型又包含了训练和验证,所以共6个JSON文件。

这3种类型共享下面所列的基本类型,包括info、image、license,而annotation类型则呈现出了多态:


    "info": info,
    "licenses": [license],
    "images": [image],
    "annotations": [annotation],

    
info
    "year": int,
    "version": str,
    "description": str,
    "contributor": str,
    "url": str,
    "date_created": datetime,

license
    "id": int,
    "name": str,
    "url": str,
 
image
    "id": int,
    "width": int,
    "height": int,
    "file_name": str,
    "license": int,
    "flickr_url": str,
    "coco_url": str,
    "date_captured": datetime,


"info":
	"description":"This is stable 1.0 version of the 2014 MS COCO dataset.",
	"url":"http:\\/\\/mscoco.org",
	"version":"1.0","year":2014,
	"contributor":"Microsoft COCO group",
	"date_created":"2015-01-27 09:11:52.357475"
,




	"license":3,
	"file_name":"COCO_val2014_000000391895.jpg",
	"coco_url":"http:\\/\\/mscoco.org\\/images\\/391895",
	"height":360,"width":640,"date_captured":"2013-11-14 11:18:45",
	"flickr_url":"http:\\/\\/farm9.staticflickr.com\\/8186\\/8119368305_4e622c8349_z.jpg",
	"id":391895
,



	"url":"http:\\/\\/creativecommons.org\\/licenses\\/by-nc-sa\\/2.0\\/",
	"id":1,
	"name":"Attribution-NonCommercial-ShareAlike License"
,

备注:

COCO JASON文件不同于Labelme的Jason文件,他们之间需要进行格式的转换。


作者主页(文火冰糖的硅基工坊):文火冰糖(王文兵)的博客_文火冰糖的硅基工坊_CSDN博客

本文网址:https://blog.csdn.net/HiWangWenBing/article/details/122174503

以上是关于[人工智能-深度学习-70]:数据集 - 目标检测常见公开数据集之MS COCO的主要内容,如果未能解决你的问题,请参考以下文章

深度学习目标检测:YOLOv5实现车辆检测(含车辆检测数据集+训练代码)

深度学习目标检测:YOLOv5实现车辆检测(含车辆检测数据集+训练代码)

可以不用人工打标制作目标检测数据集的方法

深度学习和目标检测系列教程 3-300:了解常见的目标检测的开源数据集

深度学习目标检测概述

深度学习目标检测:YOLOv5实现红绿灯检测(含红绿灯数据集+训练代码)