sklearn学习札记

Posted 2020-06-14

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了sklearn学习札记相关的知识，希望对你有一定的参考价值。

降维参考网址http://dataunion.org/20803.html

【低方差滤波 (Low Variance Filter)】需先对数据做归一化处理

【高相关滤波】认为当两列数据变化趋势相似时，它们包含的信息也相似

【随机森林】对目标属性产生许多巨大的树，然后根据对每个属性的统计结果找到信息量最大的特征子集。如果一个属性经常成为最佳分裂属性，那么它很有可能是需要保留的信息特征

【主成分分析 (PCA)】需先对数据做归一化处理，核心正交变换。 PCA 变换后会丧失数据的解释性

【反向特征消除 (Backward Feature Elimination)】

【前向特征构造 (Forward Feature Construction)】

Principal component analysis (PCA) 参考网址http://blog.csdn.net/u012162613/article/details/42192293

使用奇异值分解并保留大部分有用信息的线性降维方法。用scipy.linalg完成奇异值分解（仅适用于方阵和小型数据）。时间复杂度n^3

参数：

n_components（int, None or string）

默认n_components == min(n_samples, n_features)

n_components == ‘mle’ 猜测

copy : bool

False，传入训练模型的数据将被覆盖，需用fit_transform(X)，而非fit(X).transform(X)

whiten : bool, optional

默认False

True

以上是关于sklearn学习札记的主要内容，如果未能解决你的问题，请参考以下文章