COCO_01 数据集介绍 COCO目标检测分割数据集格式
Posted LiQiang33
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了COCO_01 数据集介绍 COCO目标检测分割数据集格式相关的知识,希望对你有一定的参考价值。
文章目录
1 COCO数据集介绍
COCO数据集是常用的目标检测和分割数据集,可以用于分类、目标检测、分割以及人体关键点检测等任务,这里我们重点关注目标检测与分割
其中
- 目标类别
object categories
80个(不包括背景) - 物体类别
stuff categories
91(包括背景,背景也被分为不同的物体类) - 情景描述
captions per image
每张图片5段情景描述 - 人体关键点
people with keypoints
25w个人进行关键点标注
**NOTE: **
stuff category
与object category
的区别:stuff类别中包含没有明确边界的对象,即包括不同背景;也可以说object category 80
是stuff category 91
的子类
COCO数据集格式官网:https://cocodataset.org/#format-data
Arxiv论文:https://arxiv.org/pdf/1405.0312.pdf
2 COCO数据集目标检测和分割格式
annotation.json
文件内容有:info, licenses, images, annotations, categories
制作自己的COCO格式主要内容有:images, annotations, categories
具体细节
2.1 images
images中是一个图片信息列表,列表中每一个元素为数据集中一个图片的基本信息,包括:图片文件的名称
、图片的高与宽
和图片ID
, 对应的json格式为:
"images": [
"file_name": 'P1_1_IMG002_frame021.png',
"height": 100,
"width": 100,
"id": 1021 // 1021第一个1表示术后
, ...
]
2.2 categories
categories为类别信息的列表,主要有类别ID
和类别名称
,其对应的json格式为:
"categories": [
"di": 2,
"name": "stent"
, ...
]
2.3 annotations
annotations为标注文件的列表,列表中的元素为一个对象的标注注意:一张图片可能有多张标注,因此这里并不是一张图片的标注,一个对象的标注信息包括目标框bbox、目标分割segmentation、目标的面积area、目标类别ID category_id、所属图片的ID image_id以及标注ID,是否为拥挤目标 iscrowd(根据情况设定)
,其json的格式为:
"Annotations": [
"segmentation": [[1.0, 2.0, ...],...], // polygon多边形
"area": 100.1, // 目标面积
"iscrowd": 0,
"image_id": 1021,
"bbox": [10, 20, 5, 6], //[x, y, w, h] 左上角xy坐标+宽和高
"category_id": 1 // 1是内腔, 2是支架
"id": 1, // 标注的ID,可以是标注顺序生成
, ...
]
NOTE:
- 分割的格式是一个点的二维数组,一般情况是只有一个数组元素,因为一般目标被标记为一个完整的连通区域;如果有多个,则表示一个目标是分开的;数组中的元素是点坐标,其格式为:
[x1, y1, x2, y2, ...]
- 目标框的格式为
x, y. width, height
,x, y为图片的左上角坐标 - 标注通过
image_id
与原图进行关联,通过category_id
与类别进行关联,id
为获取一个图片标注提供依据
参考
COCO数据集介绍:https://blog.csdn.net/qq_37541097/article/details/113247318
以上是关于COCO_01 数据集介绍 COCO目标检测分割数据集格式的主要内容,如果未能解决你的问题,请参考以下文章
COCO_04 展示COCO格式数据集 目标框与分割mask