UA-DETRAC BITVehicle车辆检测数据集(含下载地址)

Posted AI吃大瓜

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了UA-DETRAC BITVehicle车辆检测数据集(含下载地址)相关的知识,希望对你有一定的参考价值。

UA-DETRAC BITVehicle车辆检测数据集(含下载地址)

目录

UA-DETRAC BITVehicle车辆检测数据集使用说明和下载

一、车辆检测数据集介绍

1. UA-DETRAC车辆检测数据集 

2. Vehicle-Dataset车辆检测数据集  

3.BIT-Vehicle车辆检测数据集  

二.车辆检测数据集下载地址

1. UA-DETRAC车辆检测数据集

2.  Vehicle-Dataset车辆检测数据集

3.  BITVehicle车辆检测数据集

三.基于YOLOv5的车辆检测(Python)

四.手机实现车辆检测(Android)


考虑到自动驾驶算法开发,经常要用到车辆检测数据集;这里分享鄙人整合的三个车辆检测数据集:UA-DETRAC,Vehicle-Dataset和BIT-Vehicle车辆检测数据集

【尊重原则,转载请注明出处】:https://panjinquan.blog.csdn.net/article/details/127907325


一、车辆检测数据集介绍

1. UA-DETRAC车辆检测数据集 

UA-DETRAC 是一个具有挑战性的现实世界多目标检测和多目标跟踪基准。该数据集包含使用佳能 EOS 550D 相机在中国北京和天津的 24 个不同地点拍摄的 10 小时视频。视频以每秒 25 帧 (fps) 的速度录制,分辨率为 960×540 像素。UA-DETRAC 数据集中有超过 14 万帧和 8250 辆手动标注的车辆,总共有 121 万个标记的对象边界框,其中训练集约82085张图片,测试集约56167张图片。该数据集可用于多目标检测和多目标跟踪算法开发。

 官方网站The UA-DETRAC Benchmark Suite

下图展示了 DETRAC 数据集中带注释的帧。边界框的颜色反映遮挡状态,包括完全可见(红色)、部分被其他车辆遮挡(蓝色)或部分被背景遮挡(粉红色)。车辆 ID、方向、车辆类型和截断率显示在边界框中。其中浅灰色区域代表被忽略区域,这在基准测试中会被忽略。另外在每帧的左下角还显示了天气状况、摄像头状态和车辆密度。

  • 车辆类别   我们将车辆分为四类,即小汽车(car)、公共汽车(bus)、货车(van)和其他(others)。
  • 天气   我们考虑四类天气条件,即多云、夜晚、晴天和下雨。
  • 比例   我们将带注释的车辆的比例定义为其面积的平方根(以像素为单位)。我们将车辆分为三个等级:小型(0-50 像素)、中型(50-150 像素)和大型(超过 150 像素)。
  • 遮挡率   我们使用被遮挡的车辆边界框的分数来定义遮挡程度。我们将遮挡程度分为三类:无遮挡、部分遮挡和严重遮挡。具体来说,我们定义部分遮挡,如果车辆的遮挡率在 1%-50% 之间,如果遮挡率大于 50%,则定义为重度遮挡。
  • 截断率   截断率表示车辆部件超出框架的程度,用于训练样本选择。

为了方便可视化DETRAC数据集的目标检测框的效果,这里提供一个可视化Python脚本

需要用的几个python依赖包,pip安装即可:

    pip install pybaseutils
    pip install xmltodict

  • 这里没有区分可见和被遮挡的车辆,统一用蓝色框表示
  • 黑色框表示被忽略的区域(ignored_region
  • 共有四个类别:['car', 'bus', 'others', 'van']
# -*-coding: utf-8 -*-
"""
    @Author : panjq
    @E-mail : pan_jinquan@163.com
    @Date   : 2022-10-12 16:21:55
    @Brief  :
"""
import os
import cv2
import xmltodict
from tqdm import tqdm
from pybaseutils.maker import maker_voc
from pybaseutils import file_utils, image_utils


def read_xml2json(xml_file):
    """
    import xmltodict
    :param xml_file:
    :return:
    """
    with open(xml_file, encoding='utf-8') as fd:  # 将XML文件装载到dict里面
        content = xmltodict.parse(fd.read())
    return content


def get_objects_info(objects):
    """
    解析标注信息
    """
    rects = []
    labels = []
    targets = objects['target_list']['target']  # collections.OrderedDict
    if not isinstance(targets, list): targets = [targets]
    for data in targets:
        box = data['box']
        attribute = data['attribute']
        label = attribute['@vehicle_type']
        rect = [box['@left'], box['@top'], box['@width'], box['@height']]
        rect = [float(r) for r in rect]
        rects.append(rect)
        labels.append(label)
    bboxes = image_utils.rects2bboxes(rects)
    num = objects['@num']
    image_id = "img:0=5d.jpg".format(int(num))  # img00002.jpg
    return image_id, bboxes, labels


def get_ignored_region(objects):
    """获得ignored区域"""
    rects = []
    labels = []
    if not "box" in objects: return rects, labels
    for data in objects["box"]:
        label = "ignored_region"
        rect = [data['@left'], data['@top'], data['@width'], data['@height']]
        rect = [float(r) for r in rect]
        rects.append(rect)
        labels.append(label)
    bboxes = image_utils.rects2bboxes(rects)
    return bboxes, labels



def show_ua_detrac_dataset(image_dir, annot_dir, out_draw="", vis=False):
    """
    可视化车辆检测数据集
    class_set:['car', 'bus', 'others', 'van']
    :param image_dir: UA-DETRAC数据集图片(*.jpg)根目录
    :param annot_dir:  UA-DETRAC数据集标注文件(*.xml)根目录
    :param vis: 是否可视化效果
    """
    print("image_dir:".format(image_dir))
    print("annot_dir:".format(annot_dir))
    xml_list = file_utils.get_files_list(annot_dir, postfix=["*.xml"])
    class_set = []
    for annot_file in tqdm(xml_list):
        print(annot_file)
        # 将xml转换为OrderedDict格式,方便解析
        annotations = read_xml2json(annot_file)
        subname = annotations['sequence']['@name']  # UA-DETRAC子目录
        # 被忽略的区域
        ignore_bboxes, ignore_labels = get_ignored_region(annotations['sequence']['ignored_region'])
        # 遍一帧图像,获得车辆目标框
        frame_info = annotations['sequence']['frame']
        for i in range(len(frame_info)):
            image_name, bboxes, labels = get_objects_info(frame_info[i])
            image_id = image_name.split(".")[0]
            image_file = os.path.join(image_dir, subname, image_name)
            class_set = labels + class_set
            class_set = list(set(class_set))
            if not os.path.exists(image_file):
                print("not exist:".format(image_file))
                continue
            image = cv2.imread(image_file)
            image = image_utils.draw_image_bboxes_text(image, ignore_bboxes, ignore_labels,
                                                       color=(10, 10, 10), thickness=2, fontScale=1.0)
            image = image_utils.draw_image_bboxes_text(image, bboxes, labels,
                                                       color=(255, 0, 0), thickness=2, fontScale=1.0)
            if out_draw:
                dst_file = file_utils.create_dir(out_draw, None, "_.jpg".format(subname, image_id))
                cv2.imwrite(dst_file, image)
            if vis:
                image_utils.cv_show_image("det", image, use_rgb=False)
    print("class_set:".format(class_set))


if __name__ == "__main__":
    """
    pip install pybaseutils
    pip install xmltodict
    """
    image_dir = "UA-DETRAC/DETRAC-train-data/Insight-MVT_Annotation_Train"
    annot_dir = "UA-DETRAC/DETRAC-Train-Annotations-XML"
    out_draw = os.path.join(os.path.dirname(image_dir), "result")
    show_ua_detrac_dataset(image_dir, annot_dir, out_draw=out_draw, vis=True)

目标检测中,我们常使用VOC数据格式,这里实现将UA-DETRAC数据集转换为VOC数据格式,

需要特别注意的是:

  • 这里没有区分可见和被遮挡的车辆,按照原始标注,分为四个类别:['car', 'bus', 'others', 'van']
  • 原始标注文档中的ignored_region表示被忽略区域,即使有车辆,也没有检测框,因此转换VOC格式时,这部分也被忽略了(由于ignored_region也可能存在车辆,因此对目标检测会有点影响)
  • 很可惜,UA-DETRAC没有标注非机动车(如摩托车,三轮车,电动车)都没有标注
# -*-coding: utf-8 -*-
"""
    @Author : panjq
    @E-mail : pan_jinquan@163.com
    @Date   : 2022-10-12 16:21:55
    @Brief  :
"""
import os
import cv2
import xmltodict
from tqdm import tqdm
from pybaseutils.maker import maker_voc
from pybaseutils import file_utils, image_utils


def read_xml2json(xml_file):
    """
    import xmltodict
    :param xml_file:
    :return:
    """
    with open(xml_file, encoding='utf-8') as fd:  # 将XML文件装载到dict里面
        content = xmltodict.parse(fd.read())
    return content


def get_objects_info(objects):
    """
    解析标注信息
    """
    rects = []
    labels = []
    targets = objects['target_list']['target']  # collections.OrderedDict
    if not isinstance(targets, list): targets = [targets]
    for data in targets:
        box = data['box']
        attribute = data['attribute']
        label = attribute['@vehicle_type']
        rect = [box['@left'], box['@top'], box['@width'], box['@height']]
        rect = [float(r) for r in rect]
        rects.append(rect)
        labels.append(label)
    bboxes = image_utils.rects2bboxes(rects)
    num = objects['@num']
    image_id = "img:0=5d.jpg".format(int(num))  # img00002.jpg
    return image_id, bboxes, labels


def get_ignored_region(objects):
    """获得ignored区域"""
    rects = []
    labels = []
    if not "box" in objects: return rects, labels
    for data in objects["box"]:
        label = "ignored_region"
        rect = [data['@left'], data['@top'], data['@width'], data['@height']]
        rect = [float(r) for r in rect]
        rects.append(rect)
        labels.append(label)
    bboxes = image_utils.rects2bboxes(rects)
    return bboxes, labels


def converter_ua_detrac2voc(image_dir, annot_dir, out_voc, vis=True):
    """
    将车辆检测数据集UA-DETRAC转换为VOC数据格式(xmin,ymin,xmax,ymax)
    class_set:['car', 'bus', 'others', 'van']
    :param image_dir: UA-DETRAC数据集图片(*.jpg)根目录
    :param annot_dir:  UA-DETRAC数据集标注文件(*.xml)根目录
    :param out_voc: 输出VOC格式数据集目录
    :param vis: 是否可视化效果
    """
    print("image_dir:".format(image_dir))
    print("annot_dir:".format(annot_dir))
    print("out_voc  :".format(out_voc))
    xml_list = file_utils.get_files_list(annot_dir, postfix=["*.xml"])
    out_image_dir = file_utils.create_dir(out_voc, None, "JPEGImages")
    out_xml_dir = file_utils.create_dir(out_voc, None, "Annotations")
    class_set = []
    for annot_file in tqdm(xml_list):
        print(annot_file)
        # 将xml转换为OrderedDict格式,方便解析
        annotations = read_xml2json(annot_file)
        subname = annotations['sequence']['@name']  # UA-DETRAC子目录
        # 被忽略的区域
        ignore_bboxes, ignore_labels = get_ignored_region(annotations['sequence']['ignored_region'])
        # 遍一帧图像,获得车辆目标框
        frame_info = annotations['sequence']['frame']
        for i in range(len(frame_info)):
            image_name, bboxes, labels = get_objects_info(frame_info[i])
            image_id = image_name.split(".")[0]
            image_file = os.path.join(image_dir, subname, image_name)
            class_set = labels + class_set
            class_set = list(set(class_set))
            if not os.path.exists(image_file):
                print("not exist:".format(image_file))
                continue
            image = cv2.imread(image_file)
            image_shape = image.shape
            new_image_id = "_".format(subname, image_id)
            new_name = ".jpg".format(new_image_id)
            xml_path = file_utils.create_dir(out_xml_dir, None, ".xml".format(new_image_id))
            objects = maker_voc.create_objects(bboxes, labels)
            maker_voc.write_voc_xml_objects(new_name, image_shape, objects, xml_path)
            dst_file = file_utils.create_dir(out_image_dir, None, new_name)
            file_utils.copy_file(image_file, dst_file)
            # cv2.imwrite(dst_file, image)
            if vis:
                image = image_utils.draw_image_bboxes_text(image, ignore_bboxes, ignore_labels,
                                                           color=(10, 10, 10), thickness=2, fontScale=1.0)
                image = image_utils.draw_image_bboxes_text(image, bboxes, labels,
                                                           color=(255, 0, 0), thickness=2, fontScale=1.0)
                image_utils.cv_show_image("det", image, use_rgb=False)
    print("class_set:".format(class_set))




if __name__ == "__main__":
    """
    pip install pybaseutils
    pip install xmltodict
    """
    image_dir = "UA-DETRAC/DETRAC-train-data/Insight-MVT_Annotation_Train"
    annot_dir = "UA-DETRAC/DETRAC-Train-Annotations-XML"
    
    # 将车辆检测数据集UA - DETRAC转换为VOC数据格式
    out_voc = os.path.join(os.path.dirname(image_dir), "VOC")
    converter_ua_detrac2voc(image_dir, annot_dir, out_voc, vis=True)

运行完成后,会生成 Annotations和JPEGImages两个文件夹,后面就可以用于目标检测

  

2. Vehicle-Dataset车辆检测数据集  

这是来自美丽印度的车辆检测数据集,共3000张,共标注了21个类别,包含自行车(bicycle),公共汽车(bus),汽车(car),摩托车(motorbike)等常见的车辆类别;已经将标注格式转换其VOC数据格式了,可以直接用于深度学习目标检测模型训练
21个车辆类别如下:

human hauler         # 人力搬运工
bicycle              # 自行车
bus 公               # 共汽车
suv                  # 越野车
policecar            # 警车
ambulance            # 救护车
truck                # 卡车
auto rickshaw        # 自动人力车
three wheelers (CNG) # 三轮车 (CNG)
van                  # 货车
scooter              # 小型摩托车
minibus              # 小巴
army vehicle         # 军车
taxi                 # 出租车
rickshaw             # 黄包车
garbagevan           # 垃圾车
car                  # 汽车
pickup               # 皮卡
motorbike            # 摩托车
wheelbarrow          # 独轮手推车
minivan              # 小货车

3.BIT-Vehicle车辆检测数据集  

BIT-Vehicle数据集是国内车辆检测数据集,包含9850个车辆图像。数据集中有两个摄像头在不同时间和地点拍摄的大小为1600*1200 和1920*1080的图像。 图像包含照明条件、比例、车辆表面颜色和视点的变化。 

由于捕获延迟和车辆的大小,某些车辆的顶部或底部未包含在图像中。一幅图像中可能有一两辆车,因此每辆车的位置都被预先标注。 该数据集还可用于评估车辆检测的性能。 数据集中的所有车辆分为6类:公共汽车(Bus)、微型客车(Microbus)、小型货车(Minivan)、轿车(Sedan)、SUV(SUV) 和卡车(Truck)。 每种车型的车辆数量分别为558辆、883辆、476辆、5922辆、1392辆和822辆;

原始标注文档是Matlab数据格式保存(VehicleInfo.mat),现已经将标注格式转换其VOC数据格式了,可以直接用于深度学习目标检测模型训练。

Bus       # 公共汽车
Microbus  # 微型客车
Minivan   # 小型货车
SUV       # SUV车
Sedan     # 轿车
Truck     # 卡车

二.车辆检测数据集下载地址

车辆检测数据集下载资源内容包含:UA-DETRAC车辆检测数据集+Vehicle-Dataset车辆检测数据集+BITVehicle车辆检测数据集UA-DETRAC BITVehicle车辆检测数据集下载

1. UA-DETRAC车辆检测数据集

  1. UA-DETRAC车辆检测数据集: 包含原始官网下载的Train和Test数据集,以及标注文档Annotations,训练集约82085张图片,测试集约56167张图片
  2. 共4个类别:小汽车(car)、公共汽车(bus)、货车(van)和其他(others)。
  3. UA-DETRAC车辆检测数据集VOC数据格式(DETRAC-VOC): 已经将原始官网下载的Train和Test数据集转换为VOC数据格式,可以直接用于深度学习检测模型训练

2.  Vehicle-Dataset车辆检测数据集

  1. Vehicle-Dataset车辆检测数据集:总共3000张,共标注了21个类别,包含自行车(bicycle),公共汽车(bus),汽车(car),摩托车(motorbike)等常见的车辆类别;
  2. 已经将标注格式转换其VOC数据格式了,可以直接用于深度学习目标检测模型训练

3.  BITVehicle车辆检测数据集

 

  1. BITVehicle车辆检测数据集:总共9850张图片,标注了6个类别:公共汽车(Bus)、微型客车(Microbus)、小型货车(Minivan)、轿车(Sedan)、SUV(SUV) 和卡车(Truck)
  2. 已经将标注格式转换其VOC数据格式了,可以直接用于深度学习目标检测模型训练

三.基于YOLOv5的车辆检测(Python)

YOLOv5实现车辆检测(含车辆检测数据集+训练代码)
Python版本车辆检测Demo效果:


四.手机实现车辆检测(android)

正在开发中,敬请期待

以上是关于UA-DETRAC BITVehicle车辆检测数据集(含下载地址)的主要内容,如果未能解决你的问题,请参考以下文章

视频监控 智能交通 数据集(目标检测跟踪)

视频监控 智能交通 数据集(目标检测跟踪)

[深度学习][数据集][目标检测]工程车辆数据集16881张15种类别车辆介绍

#yyds干货盘点#项目实战 <-; DeepSORT算法实现车辆和行人跟踪计数和是否道路违规检测

深度学习目标检测:YOLOv5实现车辆检测(含车辆检测数据集+训练代码)

深度学习目标检测:YOLOv5实现车辆检测(含车辆检测数据集+训练代码)