sklearn中各算法类的fit,fit_transform和transform函数

Posted 上官栋

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了sklearn中各算法类的fit,fit_transform和transform函数相关的知识,希望对你有一定的参考价值。

在使用PCA和NFC中有三个函数fit,fit_transform,transform区分不清各自的功能。通过测试,勉强了解各自的不同,在这里做一些笔记。

1.fit_transform是fit和transform的混合,相当于先调用fit再调用transform。

2.transform函数必须在fit函数之后调用否则会报错

3.fit_transform返回的是降维之后的结果,而且是对列压缩的

4.fit函数返回的是算法类,但是其成员变量components_是有数据的,而且似乎也是执行算法之后的结果,不过是对行压缩的。将数据转置后代入fit函数,和使用fit_transform得到的结果是不一样的,但是很接近。说明fit也是做了一定的特征提取的,只不过是对行操作的。

至于详细的区别目前没找到有人说明。只是建议使用fit_transform,若要使用fit,注意这个函数是对行压缩的

以上是关于sklearn中各算法类的fit,fit_transform和transform函数的主要内容,如果未能解决你的问题,请参考以下文章

将 Sklearn TFIDF 与其他数据相结合

在 fit 方法采用 3 个参数的自定义类上使用 sklearn GridSearchCV

通俗得说线性回归算法线性回归实战

sklearn.decomposition.DicitonaryLearning.fit 中的 y 参数有啥作用?

GridSearchCV/RandomizedSearchCV 与 sklearn 中的 partial_fit

sklearn fit transform fit_transform