图像检测相关模型数据格式

Posted 狂奔的CD

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了图像检测相关模型数据格式相关的知识,希望对你有一定的参考价值。

yolox

数据集

目录格式如下(改造后)

folder
    |——annotations
          |——train.json
          |——val.json
          |——test.json
    |——JPEGImages
          |——*.jpg

标注数据格式


    "categories":[
        
            "id":0,
            "name":"cat",
            "supercategory":""
        ,
        
            "id":1,
            "name":"people",
            "supercategory":""
        
    ],
    "images":[
        
            "id":1,
            "file_name":"1654506696.jpg",
            "width":1920,
            "height":1080
        ,
        
            "id":2,
            "file_name":"1654506697.jpg",
            "width":1920,
            "height":1080
        ,
        ...
    ],
  "annotations":[
        
            "id":1,
            "image_id":1,
            "category_id":2,
            "bbox":[
                622,
                840,
                396,
                237
            ]
        ,
        
            "id":2,
            "image_id":1,
            "category_id":1,
            "bbox":[
                537,
                478,
                209,
                358
            ]
        ,
        
            "id":3,
            "image_id":2,
            "category_id":2,
            "bbox":[
                555,
                732,
                406,
                337
            ]
        ,
        ...
      ]

bbox含义:[ l, t, w, h]

yolo5

数据集

目录格式如下(改造后)

folder
    |——images
          |——train
               |——*.jpg
          |——val
               |——*.jpg
          |——test
               |——*.jpg
    |——labels
          |——train
               |——*.txt
          |——val
               |——*.txt
          |——test
               |——*.txt

标注数据格式

# (标签  centerx centery  width height)   比例
0	0.9143518518518519	0.32317708333333334	0.1712962962962963	0.2578125
0	0.4111111111111111	0.34609375	0.3074074074074074	0.2671875
0	0.0824074074074074	0.4140625	0.1648148148148148	0.18541666666666667

推理输出格式

l,t,r,b

paddlex实例分割

数据格式

 	"categories":[
		        
		            "id":1,
		            "name":"xx",
		            "color":[
		                0,
		                255,
		                0
		            ],
		            "supercategory":""
		        
        ],
        "images":[
	        	
	            "id":1,
	            "width":1080,
	            "height":610,
	            "file_name":"1657071181775.jpg",
	            "license":"",
	            "flickr_url":"",
	            "coco_url":"",
	            "date_captured":""
	        ,
		        
	            "id":2,
	            "width":1080,
	            "height":610,
	            "file_name":"1657071181775.jpg",
	            "license":"",
	            "flickr_url":"",
	            "coco_url":"",
	            "date_captured":""
	        
        ],
        "annotations":[
			        
			            "id":0,
			            "image_id":0,
			            "bbox":[
			                449.93353271484375,
			                31.76203155517578,
			                340.86328125,
			                469.9315414428711
			            ],
			            "segmentation":[
			            	101,
			            	526,
			            	...
			            ],
			            "area":0,
			            "iscrowd":0,
			            "category_id":1
           			
         ]

以上是关于图像检测相关模型数据格式的主要内容,如果未能解决你的问题,请参考以下文章

图像检测相关模型数据格式

目标检测中的数据格式转换工具Roboflow

MATLAB教程案例31基于matlab的人脸检测相关算法的仿真与分析——肤色模型与形态学图像处理方法

等待图像的格式更改

VOC数据集 目标检测

加载人像检测模型的代码是