sklearn学习札记

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了sklearn学习札记相关的知识,希望对你有一定的参考价值。

 

降维 参考网址http://dataunion.org/20803.html

【低方差滤波 (Low Variance Filter)】需先对数据做归一化处理

【高相关滤波】认为当两列数据变化趋势相似时,它们包含的信息也相似

【随机森林】对目标属性产生许多巨大的树,然后根据对每个属性的统计结果找到信息量最大的特征子集。如果一个属性经常成为最佳分裂属性,那么它很有可能是需要保留的信息特征

【主成分分析 (PCA)】需先对数据做归一化处理,核心正交变换。 PCA 变换后会丧失数据的解释性

【反向特征消除 (Backward Feature Elimination)】

【前向特征构造 (Forward Feature Construction)】

Principal component analysis (PCA) 参考网址http://blog.csdn.net/u012162613/article/details/42192293

使用奇异值分解并保留大部分有用信息的线性降维方法。用scipy.linalg完成奇异值分解(仅适用于方阵和小型数据)。时间复杂度n^3

参数:

n_components(int, None or string)

默认n_components == min(n_samples, n_features)

n_components == ‘mle’ 猜测

 

copy : bool

False,传入训练模型的数据将被覆盖,需用fit_transform(X),而非fit(X).transform(X)

whiten : bool, optional

默认False

True

以上是关于sklearn学习札记的主要内容,如果未能解决你的问题,请参考以下文章

Git学习札记

SQL菜鸟学习札记

JAVA学习札记

Informix学习札记

Python学习札记-eval函数

嵌入式技术基础与实践-学习札记