PCA主成分分析

Posted geekdanny

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了PCA主成分分析相关的知识,希望对你有一定的参考价值。

主成分分析

PCA:principal component analysis
主成分分析是最常用的一种降维分析
目的:降低数据的复杂性,找到最有用的特征
降维:

  • PCA
  • FA 因子分析 factor analysis
  • ICA 独立成分分析 independent component analysis

PCA概述:
将数据从原来的坐标系转换到新的坐标系,新坐标的选择和数据本身相关。第一个新坐标轴是原数据中方差最大的方向,第二个坐标选择和第一个坐标正交且具有最大方差的方向。

数据最大方差方向

方差最大,就是数据差异性最大
计算协方差矩阵&特征值分析

特征值分析

[A u=lambda u]
特征值(lambda)和特征向量( u)
可以使用Numpy中linalg模块的eig()

numpy.linalg.eig(a)
# Compute the eigenvalues and right eigenvectors of a square array.

from numpy import linalg as LA
w, v = LA.eig(np.diag((1, 2, 3)))
w; v
"""
array([ 1.,  2.,  3.])
array([[ 1.,  0.,  0.],
       [ 0.,  1.,  0.],
       [ 0.,  0.,  1.]])
"""







以上是关于PCA主成分分析的主要内容,如果未能解决你的问题,请参考以下文章

PCL:主成分分析(PCA)原理与实现

主成分分析PCA

主成分分析-PCA

主成分分析(PCA)

主成分分析(PCA)

详解主成分分析PCA