使用scikit-learn 估计器分类
Posted junge-mike
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用scikit-learn 估计器分类相关的知识,希望对你有一定的参考价值。
本章的几个概念:
估计器(estimator) 用于分类、聚类和回归分析
转换器(transformer):用于数据预处理回来数据转换
流水线(pipeline): 组合数据挖掘流程, 便于在此使用
1.scikit-learn估计器
数据集下载地址:UCI
加载数据集:
实现流程的标准化:
设置参数:
2.流水线在预处理中的使用
不同特征的取值范围千差万别, 常见的方法是对不同的特征进行规范化,使他们的特征值落在相同的值域或者是属于某几个确定的类别
一旦解决这个问题, 不同的特征类型对算法的影响将大大降低, 分类的正确率就有大大的提升
sckit-learn 的预处理工具 称为 转换器(Transfomer),它接受原始数据集, 返回的是转换后的数据集。除了,处理数值型的特征还能用于抽取特征
以上是关于使用scikit-learn 估计器分类的主要内容,如果未能解决你的问题,请参考以下文章
scikit-learn 的 BaggingClassifier 和自定义基础估计器的问题:操作数不能一起广播?