MATLAB中深度学习的数据集合

Posted 2022-01-13 卓晴

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了MATLAB中深度学习的数据集合相关的知识，希望对你有一定的参考价值。

简介：本文总结了部分MATLAB中用于深度学习的数据集合。

关键词： MATLAB，DEEPLENARING

§01 MATLAB数据

在 Data Sets for Deep Learning 给出了MATLAB中用于深度学习的数据集合介绍以及下载方法。

1.1 合成数字图片

这是一个10000个灰度合成数字姿态的数字集合。类似于MNIST，但它是合成的。

问题来了，这些数字是如何被合成的？在哪儿可以下载到原始的数据集合呢？

数据库参数：

数量：10000
尺寸：28×28
色彩：灰度图片

▲ 图1.1.1 MATLAB Digits Dataset

1.2 MNSIT手写数字图片

该集合包括有70,000个图片，分为60,000训练集合以及10,000个测试集合。

图片库参数：

数量：70,000
色彩：灰度图片
尺寸：28×28

下载链接： MNIST官网下载地址 : http://yann.lecun.com/exdb/mnist/

▲ 图1.2.1 MNIST代表数字

1.3 字母表

Omniglot数据集合包含有50个字母表，保安有30个训练集合，20个测试集合。每个字符包含有一定数量EZif是， Ojibwe编号：14（这是加拿大欧土著音节字符）， Tifinagh：编号55。每个字符有20个手写字体。

下载链接： Omniglot : https://github.com/brendenlake/omniglot
▲ 图1.3.1 Omniglot字符数据集合

1.4 FLower数据集合

这是一个3670个花朵图片数据集合，分为五大类：Daisy（黛西）， Dandelion（蒲公英）， Roses（玫瑰花）， Sunflowers（向日葵）， Tulips（郁金香）。

数据库参数：

数量：3670
色彩：彩色
种类：5类
文件大小：218MB

**数据集合下载： ** Flowers : http://download.tensorflow.org/example_images/flower_photos.tgz
▲ 图1.4.1 Flowers数据集合

1.5 食物图片

图片库参数：

数量：978
色彩：彩色
种类：9类：Caesar_Salad, Caprese_salard, French_fires, Greek_salard, Hamburger, Hot_dog, Pizza, Sashimi, Suhi.
数据文件：77MB

▲ 图1.5.1 食物图片

数据库下：

1.6 Cifar-10

数据库参数：

数量：60,000
色彩：彩色
尺寸：32×32
种类：10个类别:Airplane,Automobile,Bird,Car,Deer,Dog,Frog,Horse,Ship,Truck
每个类别：6000

▲ 图1.6.1 Cifar10图片

下载链接 : https://www.cs.toronto.edu/~kriz/cifar-10-matlab.tar.gz

1.7 零售商品图片集合

这个数据集合包括有5类Mathworks公司相关的零售商品。

数据集合参数：

数量：不详
种类：5类:Cap, Cube, Playing Cards, Torch
尺寸：227×227
色彩：彩色

▲ 图1.7.1 Mathworks 零售商品图片集

1.8 街景数据

CamVid 数据集合是一组街景图品集合，从小轿车内部拍摄。用于训练网络对图片进行语义分割。改数据集合提供了32类像素级别语义标注。包括：轿车，行人，道路等。

数据参数：

数量：不详
尺寸：720×960
色彩：彩色
文件大小：573MB

▲ 图1.8.1 CamVid 街景图片数据集合

下载链接： CamVid数据集合 : http://web4.cs.ucl.ac.uk/staff/g.brostow/MotionSegRecData/

1.9 车辆Vechicle

Vehicle数据集合包括有295个图片，其中包含有1到2个车龄。适合于YOLO-v2的图像定位训练，但如果要达到实际应用，还需要更多的标注图片。

数据集合参数：

数量：295
色彩：彩色
尺寸：720×960

1.10 RIT-18纽约地区无人机图片

这个数据集合包括有四旋翼无人机在纽约 Hamlin Beach 州立公园拍摄的图片。包括有18种物品标注：道路标志，树木，建筑物。

数据库参数：

文件大小：3GB
色彩：彩色
种类：18种类

▲ 图1.10.1 RIT-18数据集合

1.11 BraTS脑肿瘤核磁共振图片

BarTS数据集合包含有脑肿瘤（神经胶质瘤 Glioms）这是主要脑部病变。

数据库参数：

数量：740
维度：4D
尺寸：240×240×155×4
文件大小：7GB

▲ 图1.11.1 脑部肿瘤数据库

§02 数据库名称与数量

2.1 Camelyon16

▲ 图2.1.1 Camelyon16

2.2 Challenge

▲ 图2.2.1 Low Dose CTGrand Challenge

2.3 数据集合

▲ 图2.3.1 COCO：Common Objects in Context

2.4 TC-12

▲ 图2.4.1 IAPRTC-12

2.5 RGB

▲ 图2.5.1 Zuirch RAW to RGB

2.6 See-in-The-Dark

▲ 图2.6.1 See-In-The-Dark

2.7 Wild

▲ 图2.7.1 LIVE in the Wild

2.8 Classification

▲ 图2.8.1 Conrete Crake Image for Classifiction

※ 总结 ※

本文总结了部分MATLAB中用于深度学习的数据集合。

■ 相关文献链接:

● 相关图表链接:

图1.1.1 MATLAB Digits Dataset
图1.2.1 MNIST代表数字
图1.3.1 Omniglot字符数据集合
图1.4.1 Flowers数据集合
图1.5.1 食物图片
图1.6.1 Cifar10图片
图1.7.1 Mathworks 零售商品图片集
图1.8.1 CamVid 街景图片数据集合
图1.10.1 RIT-18数据集合
图1.11.1 脑部肿瘤数据库
图2.1.1 Camelyon16
图2.2.1 Low Dose CTGrand Challenge
图2.3.1 COCO：Common Objects in Context
图2.4.1 IAPRTC-12
图2.5.1 Zuirch RAW to RGB
图2.6.1 See-In-The-Dark
图2.7.1 LIVE in the Wild
图2.8.1 Conrete Crake Image for Classifiction

◎ 参考文档：

[1] Lake, Brenden M., Ruslan Salakhutdinov, and Joshua B. Tenenbaum. “Human-Level Concept Learning through Probabilistic Program Induction.” Science 350, no. 6266 (December 11, 2015): 1332–38. https://doi.org/10.1126/science.aab3050.

[2] The TensorFlow Team. “Flowers” https://www.tensorflow.org/datasets/catalog/tf_flowers.

[3] Kat, Tulips, image, https://www.flickr.com/photos/swimparallel/3455026124.Creative Commons License (CC BY).

[4] Rob Bertholf, Sunflowers, image, https://www.flickr.com/photos/robbertholf/20777358950.Creative Commons 2.0 Generic License.

[5] Parvin, Roses, image, https://www.flickr.com/photos/55948751@N00.Creative Commons 2.0 Generic License.

[6] John Haslam, Dandelions, image, https://www.flickr.com/photos/foxypar4/645330051.Creative Commons 2.0 Generic License.

[7] Krizhevsky, Alex. “Learning Multiple Layers of Features from Tiny Images.” MSc thesis, University of Toronto, 2009. https://www.cs.toronto.edu/~kriz/learning-features-2009-TR.pdf.

[8] Brostow, Gabriel J., Julien Fauqueur, and Roberto Cipolla. “Semantic Object Classes in Video: A High-Definition Ground Truth Database.” Pattern Recognition Letters 30, no. 2 (January 2009): 88–97. https://doi.org/10.1016/j.patrec.2008.04.005.

[9] Kemker, Ronald, Carl Salvaggio, and Christopher Kanan. “High-Resolution Multispectral Dataset for Semantic Segmentation.” ArXiv:1703.01918 [Cs], March 6, 2017. https://arxiv.org/abs/1703.01918.

[10] Isensee, Fabian, Philipp Kickingereder, Wolfgang Wick, Martin Bendszus, and Klaus H. Maier-Hein. “Brain Tumor Segmentation and Radiomics Survival Prediction: Contribution to the BRATS 2017 Challenge.” In Brainlesion: Glioma, Multiple Sclerosis, Stroke and Traumatic Brain Injuries, edited by Alessandro Crimi, Spyridon Bakas, Hugo Kuijf, Bjoern Menze, and Mauricio Reyes, 10670: 287–97. Cham, Switzerland: Springer International Publishing, 2018. https://doi.org/10.1007/978-3-319-75238-9_25.

[11] Ehteshami Bejnordi, Babak, Mitko Veta, Paul Johannes van Diest, Bram van Ginneken, Nico Karssemeijer, Geert Litjens, Jeroen A. W. M. van der Laak, et al. “Diagnostic Assessment of Deep Learning Algorithms for Detection of Lymph Node Metastases in Women With Breast Cancer.” JAMA 318, no. 22 (December 12, 2017): 2199. https://doi.org/10.1001/jama.2017.14585.

[12] McCollough, C.H., Chen, B., Hol

以上是关于MATLAB中深度学习的数据集合的主要内容，如果未能解决你的问题，请参考以下文章

MATLAB深度学习采用 Deeplab v3+ 实现全景分割

数学建模MATLAB应用实战系列（九十）-变异系数法应用案例（附MATLAB和Python代码）

DELM分类基于matlab麻雀搜索算法改进深度学习极限学习机数据分类含Matlab源码 2235期

深度学习matlab图像分类，手把手教程系列

堆叠抓取+深度学习基于深度学习+PPO深度强化学习的堆叠物体抓取算法的MATLAB仿真

数学建模MATLAB应用实战系列（九十）-TOPSIS法应用案例（附MATLAB和Python代码）