常用machine learning数据集
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了常用machine learning数据集相关的知识,希望对你有一定的参考价值。
ImageNet:非商业化的可视化大数据
截止到2015年5月1日,ImageNet数据库拥有超过1500万的图像。
cifar10:10类物体识别数据集
数据集中包含60,000幅32*32图像,共10类物体(6,000幅图像/类)
其中,50,000作为training images,10,000作为testing images
mnist:手写字体识别数据集
即10类数据识别问题,数字0-9,每个数字图像为28*28的黑白图像,每个数字有6,000幅图像
整个数据集包含60,000幅图像(6,000/数字),其中,60,000 training examples和10,000 testing examples
以上是关于常用machine learning数据集的主要内容,如果未能解决你的问题,请参考以下文章
机器学习计/算机视觉数据集UCI Machine Learning Repository
利用KNIME建立Spark Machine learning模型 2:泰坦尼克幸存预测