sklearn工具-python数据集操作API

Posted linyk

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了sklearn工具-python数据集操作API相关的知识,希望对你有一定的参考价值。

一、python科学计算环境

  • Python库: pandas、numpy、scipy、Scikit-Image、Scikit-Learn、matplotlib

  • 功能介绍

技术图片

技术图片

技术图片

技术图片

技术图片

技术图片

二、SKlearn算法库的顶层设计

  • SKlearn监督学习的各个模块

技术图片

  • SKlearn无监督学习模块

技术图片

  • SKlearn数据变换模块

技术图片

  • SKlearn算法类顶层设计图

技术图片

  • SKlearn算法类继承关系图

svm--以支持向量机为例

技术图片

cluster--以K-Means和MeanShift为例

技术图片

feature_extraction--以FeatureHasher和DictVectorizer为例

技术图片

三、SKlearn统一API调用接口

  • 六大板块统一API

    • 分类、回归、聚类、维数约简、特征抽取选择、数据预处理

技术图片

* 监督学习工作流程

技术图片

* 无监督学习工作流程

技术图片

* 数据预处理工作流程

技术图片

* 无监督工作流程:聚类

技术图片

  • 学习顺序

技术图片

四、SKlearn数据集操作API

技术图片

  • 自带的小数据集--鸢尾花

技术图片

  * from sklearn.datasets import load_iris
        iris = load_iris()
  • 手写数字识别

技术图片

  • 乳腺癌数据集

技术图片

  • 糖尿病数据集

技术图片

  • 波士顿房价数据集

技术图片

  • 体能训练数据集

技术图片

  • 图像数据集

技术图片

  • svmlight/libsvm格式的数据集

技术图片

  • 可在线下载的数据集

技术图片

技术图片

技术图片

技术图片

技术图片

技术图片

以上是关于sklearn工具-python数据集操作API的主要内容,如果未能解决你的问题,请参考以下文章

k近邻算法api初步使用

『Sklearn』自带数据集API

k近邻算法api初步使用

初识人工智能:机器学习:sklearn数据集

Python——sklearn提供的自带的数据集

sklearn工具-数据集变换