深度学习和目标检测系列教程 3-300:了解常见的目标检测的开源数据集
Posted 刘润森!
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了深度学习和目标检测系列教程 3-300:了解常见的目标检测的开源数据集相关的知识,希望对你有一定的参考价值。
@Author:Runsen
计算机视觉中具有挑战性的主题之一,对象检测,可帮助组织借助数字图片作为输入来理解和识别实时对象。大量的论文基于常见的目标检测的开源数据集而来,因此需要了解常见的目标检测的开源数据集
- https://public.roboflow.com/object-detection
CIFAR-10
CIFAR-10 是一个综合数据集,由 10 个不同类别的 60,000 张彩色图像组成。该数据集包含 10,000 张测试图像和 50,000 张训练图像,分为五个训练组。
点击下面链接了解有关数据集的更多信息 和CIFAR-10/100和 ImageNet 与 PyTorch分类的链接。
- http://www.cs.toronto.edu/~kriz/cifar.html
- https://github.com/bearpaw/pytorch-classification
COCO
MS COCO 是一个大规模对象检测数据集,它解决了场景识别中的三个核心分析问题。检测对象的非标志性场景(或非规范视角)、对象内的上下文推理以及对象的准确 2D 定位。
该数据集具有特定特征,例如对象分割、情境识别、超像素素材分割、150 万个对象实例、80 个对象类等。
点击下面链接了解有关数据集的更多信息 和教程的链接。
- https://cocodataset.org/#home
- https://cv.gluon.ai/contents.html
LISA 交通标志检测数据集:
LISA 或智能安全汽车交通标志数据集实验室是一组包含美国交通标志的带注释的帧和视频。该数据集包括从不同相机收集的图像、47 种美国标志类型以及 6610 个边界上的 7855 个注释。LISA 分两个阶段发布,即一个有照片,一个有视频和图片。
点击下面链接了解有关数据集的更多信息 和Kaggle 上 LISA 交通标志检测代码讨论的链接。
- http://cvrr.ucsd.edu/LISA/lisa-traffic-sign-dataset.html
- https://www.kaggle.com/mbornoe/lisa-traffic-light-dataset/code
Open Image
Open Image 是一个包含大约 900 万张图片的数据集,这些图片带有图像级标签、对象边界框、对象分割掩码、视觉关系和本地化叙述。
该数据集包括 1600 万个边界框,用于 190 万张图像上的 600 种对象类型,使其成为当前最重要的具有对象位置注释的数据集。这些框基本上是由专家注释者手动勾画的,以确保效率和一致性。
Open Images 还授予视觉关系注释,指示相关关系中的对象对、对象属性和人类活动。
点击下面链接了解有关数据集的更多信息 和基于Google Open Images 数据集的自定义子集构建卷积神经网络机器学习分类器。
- https://storage.googleapis.com/openimages/web/factsfigures.html
- https://github.com/quiltdata/open-images
ExDark
Exclusively Dark (ExDARK) 是一个独特的低光图像数据集,它提供了一组主要的图像,用于对低光分析工作进行基准测试,并将相互不同的专业领域集中在低光条件下,例如,图像理解、图像增强,物体检测等。
该数据集是 7,363 张低光照片的组合,从极低光条件到黄昏(即十个不同状态),12 个对象类别(与 PASCAL VOC 相关)在图像分类级别和局部目标是边界框上进行注释。
点击下面链接了解有关数据集的更多信息 和使用 TensorFlow 的对象检测 API 实现了 Faster R-CNN 模型,以识别从 ExDark 数据集获取的图像中的对象
- https://github.com/cs-chan/Exclusively-Dark-Image-Dataset
- https://github.com/hmshreyas7/low-light-detection
DOTA
DOTA 是用于航空视觉中物体检测的海量数据集。可以练习开发和估计航拍照片中的物体检测器。图片是从各种传感器和阶段收集的。每张印刷品的尺寸从 800 × 800 到 20,000 × 20,000 像素不等,包括呈现各种比例、方向和图案的对象。
点击下面链接了解有关数据集的更多信息 和在 DOTA 上训练的模型代码库的链接。
- https://hyper.ai/datasets/4920
BDD100K
BDD100K 是独立多任务学习的驱动数据集。该数据集包含 10 个任务和 10 万个视频,用于估计自动驾驶图像识别算法的进展。
该数据集上的功能包括多目标分割跟踪、图像标记、道路目标检测、语义分割、车道检测、可行驶区域分割、实例分割、多目标检测跟踪、域采用和模仿训练。
点击下面链接了解有关数据集的更多信息通过提出FCN+LSTM 模型
- https://github.com/bdd100k/bdd100k
- https://github.com/gy20073/BDD_Driving_Model
VOC
PASCAL VOC为图像识别和分类提供了一整套标准化的优秀的数据集,这是一个监督学习的问题,训练集以带标签的图片的形式给出。这些物体包括20类
Pascal VOC网址:
http://host.robots.ox.ac.uk/pascal/VOC/
查看各位大牛算法的排名的Leaderboards:http://host.robots.ox.ac.uk:8080/leaderboard/main_bootstrap.php
训练/验证数据集下载(2G):host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
ImageNet
ImageNet是一个计算机视觉系统识别项目,是目前世界上图像识别最大的数据库。
大约1500万张图片,2.2万类,每张都经过严格的人工筛选与标记。ImageNet类似于图片所有引擎。
其中,包括边界框的目标检测数据集,训练数据集包括500,000张图片,属于200类物体。
ImageNet数据集介绍以及下载链接:
http://www.image-net.org/
以上是关于深度学习和目标检测系列教程 3-300:了解常见的目标检测的开源数据集的主要内容,如果未能解决你的问题,请参考以下文章
深度学习和目标检测系列教程 22-300:关于人体姿态常见的估计方法
深度学习和目标检测系列教程 22-300:关于人体姿态常见的估计方法
深度学习和目标检测系列教程 8-300:目标检测常见的标注工具LabelImg和将xml文件提取图像信息
深度学习和目标检测系列教程 12-300:常见的opencv的APi和用法总结(上)