1.1.3:sklearn库中的标准数据集及基本功能

Posted nishida-rin

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了1.1.3:sklearn库中的标准数据集及基本功能相关的知识,希望对你有一定的参考价值。

sklearn的数据集种类:

  • 自带的小数据集(packaged dataset):sklearn.datasets.load_<name>
  • 可在线下载的数据集(Downloaded Dataset):sklearn.datasets.fetch_<name>
  • 计算机生成的数据集(Generated Dataset):sklearn.datasets.make_<name>
  • svmlight/libsvm格式的数据集:sklearn.datasets.load_svmlight_file(...)
  • 从买了data.org在线下载获取的数据集:sklearn.datasets.fetch_mldata(...)

sklearn自带的小数据集

技术图片技术图片?

技术图片技术图片?

波士顿房价数据集包含506组数据,每条数据包含房屋以及房屋
周围的详细信息。其中包括城镇犯罪率、一氧化氮浓度、住宅平均房
间数、到中心区域的加权距离以及自住房平均房价等。因此,波士顿
房价数据集能够应用到回归问题上。
 
 

以波士顿房价为例:

使用sklearn.datasets.load_boston即可加载相关数据集
其重要参数为:
return_X_y:表示是否返回target(即价格),默认为False,只返回data(即属性)
 
示例1:
>>> from sklearn.datasets import load_boston
>>> boston = load_boston()
>>> print(boston.data.shape)
(506, 13)
技术图片

示例2:

>>> from sklearn.datasets import load_boston
>>> data, target = load_boston(return_X_y=True)
>>> print(data.shape)
(506, 13)
>>> print(target.shape)
(506)
技术图片

图像展示

技术图片技术图片?

sklearn库的基本功能

sklearn库的共分为6大部分,分别用于完成分类任务、回归任务、
聚类任务、降维任务、模型选择以及数据的预处理(本专题主要介绍前四部分内容)

分类任务

技术图片技术图片?

回归任务

技术图片技术图片?

聚类任务

技术图片技术图片?

降维任务

技术图片技术图片?

以上是关于1.1.3:sklearn库中的标准数据集及基本功能的主要内容,如果未能解决你的问题,请参考以下文章

零基础学Python--机器学习:数据集及特征工程介绍

Python初探——sklearn库中数据预处理函数fit_transform()和transform()的区别

机器学习应用——导学part

《深入实践C++模板编程》之六——标准库中的容器

sklearn 学习

使用 sklearn 库中的 KMeans 实现彩色图像聚类分割