scikit-learn内置数据集
Posted energy1010
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了scikit-learn内置数据集相关的知识,希望对你有一定的参考价值。
scikit-learn 现在最新稳定版本为0.20.0
提供了以下几个数据集
其中数据路径都在sklearn包下的datasets/data目录下
下面我分别介绍每个数据集
iris
iris是个多类别数据集,每个类别下有50个样本,特征4维,且都是实数类型, 适用于分类模型
boston
预测boston房价, 都是实数特征,总共13维, 适用于回归模型
digits
数据由8*8的图片组成,共64维特征,0-9共10个类别,适用于分类模型
toy
toy数据6*2, 共2维特征, 两类, 适用于简单的二分类
clf_small
clf共14维特征,0,1两类别,适用于简单二分类模型
reg_small
共14维特征, 适用于简单回归模型
multilabel
人工制造的30*10维的多标签数据
sparse-pos
sparse-neg
sparse-mix
zeros
以上是关于scikit-learn内置数据集的主要内容,如果未能解决你的问题,请参考以下文章