图像检测相关模型数据格式
Posted 狂奔的CD
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了图像检测相关模型数据格式相关的知识,希望对你有一定的参考价值。
yolox
数据集
目录格式如下(改造后)
folder
|——annotations
|——train.json
|——val.json
|——test.json
|——JPEGImages
|——*.jpg
标注数据格式
"categories":[
"id":0,
"name":"cat",
"supercategory":""
,
"id":1,
"name":"people",
"supercategory":""
],
"images":[
"id":1,
"file_name":"1654506696.jpg",
"width":1920,
"height":1080
,
"id":2,
"file_name":"1654506697.jpg",
"width":1920,
"height":1080
,
...
],
"annotations":[
"id":1,
"image_id":1,
"category_id":2,
"bbox":[
622,
840,
396,
237
]
,
"id":2,
"image_id":1,
"category_id":1,
"bbox":[
537,
478,
209,
358
]
,
"id":3,
"image_id":2,
"category_id":2,
"bbox":[
555,
732,
406,
337
]
,
...
]
bbox含义:[ l, t, w, h]
yolo5
数据集
目录格式如下(改造后)
folder
|——images
|——train
|——*.jpg
|——val
|——*.jpg
|——test
|——*.jpg
|——labels
|——train
|——*.txt
|——val
|——*.txt
|——test
|——*.txt
标注数据格式
# (标签 centerx centery width height) 比例
0 0.9143518518518519 0.32317708333333334 0.1712962962962963 0.2578125
0 0.4111111111111111 0.34609375 0.3074074074074074 0.2671875
0 0.0824074074074074 0.4140625 0.1648148148148148 0.18541666666666667
推理输出格式
l,t,r,b
paddlex实例分割
数据格式
"categories":[
"id":1,
"name":"xx",
"color":[
0,
255,
0
],
"supercategory":""
],
"images":[
"id":1,
"width":1080,
"height":610,
"file_name":"1657071181775.jpg",
"license":"",
"flickr_url":"",
"coco_url":"",
"date_captured":""
,
"id":2,
"width":1080,
"height":610,
"file_name":"1657071181775.jpg",
"license":"",
"flickr_url":"",
"coco_url":"",
"date_captured":""
],
"annotations":[
"id":0,
"image_id":0,
"bbox":[
449.93353271484375,
31.76203155517578,
340.86328125,
469.9315414428711
],
"segmentation":[
101,
526,
...
],
"area":0,
"iscrowd":0,
"category_id":1
]
以上是关于图像检测相关模型数据格式的主要内容,如果未能解决你的问题,请参考以下文章