PCA(主成分分析)算法

Posted algori

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了PCA(主成分分析)算法相关的知识,希望对你有一定的参考价值。

设有\\(m\\)个指标,\\(n\\)个样本的原始数据

  1. 将原始数据按列组成矩阵 \\(X _ n \\times m \\)
  2. \\(X\\) 的每一列进行中心化
  3. \\(X\\)的协方差矩阵\\(\\Sigma _ X = \\frac 1 n - 1 X ^ T X\\)
  4. 求出 \\(\\Sigma _ X \\) 的特征值及对应的特征向
  5. 将特征值按照从大到小构成对角矩阵\\(\\Lambda = \\left( \\beginarray l l l l \\lambda _ 1 & \\lambda _ 2 & \\cdots & \\lambda _ m \\endarray \\right)\\) 将特征向量按照对应特征值构成矩阵 \\(A\\)
  6. 根据贡献率确定主成分个数\\(r\\)
  7. 根据主成分个数\\(r\\),选择\\(A\\)的前\\(r\\)列构成矩阵\\(P\\)
  8. \\(Y=XP\\)即为主成分得分

注意:以上步骤中矩阵 \\(X\\),\\(Y\\)的列表示指标,矩阵\\(A\\),\\(P\\)的列表示特征向量
若需要推导步骤,留言后我会抽时间整理上传

敬请大家批评指正

声明

欢迎转载,请注明出处和作者。
作者:Arlen Lee
出处:https://www.cnblogs.com/algori/p/11141551.html

以上是关于PCA(主成分分析)算法的主要内容,如果未能解决你的问题,请参考以下文章

主成分分析(PCA)原理及R语言实现

主成分分析-PCA

主成分分析(PCA)

主成分分析法

PCA主成分分析+白化

5.7 tensorflow2实现主成分分析(PCA) ——python实战(上篇)