PCA
Posted xcxy-boke
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了PCA相关的知识,希望对你有一定的参考价值。
PCA本质上是一个有损的特征压缩过程,但是我们期望损失的精度尽可能地少,也就是希望压缩的过程中保留最多的原始信息。要达到这种目的,我们希望降维(投影)后的数据点尽可能地分散。
基于这种思想,我们希望投影后的数据点尽可能地分散。而这种分散程度在数学上可以利用方差来表示。设降维后的特征为 A,也就是希望 $var(A)= \frac1m\sum_i^m(a_i-\mu_a )^2$,而由于在PCA降维前,一般已经做了特征零均值化处理,为了方便,记$var(A)= \frac1m\sum_i^m(a_i)^2$
以上是关于PCA的主要内容,如果未能解决你的问题,请参考以下文章
机器学习面试问答:PCA算法介绍?PCA算法过程?PCA为什么要中心化处理?PCA为什么要做正交变化?PCA与线性判别分析LDA降维的区别?