主成成分分析-PCA(principal component annlysis)
Posted go-ahead-wsg
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了主成成分分析-PCA(principal component annlysis)相关的知识,希望对你有一定的参考价值。
PCA是用来给多维数据降维,分析提取主成分的一种算法;
怎么实现的呢?首先说明,在已标注和未标注的数据上都有降维技术,PCA是一种在对未标注数据的降维技术。
在PCA中,数据从原来的坐标系转换到了新的坐标系,新坐标系的选择是由数据本身决定的。第一个新坐标轴选择的是原始数据中方差最大的方向,第二个新坐标轴的选择和第一个坐标轴正交且具有最大方差的方向。该过程一直重复,重复次数为原始数据中特征的数目。我们会发现,大部分方差都包含在最前面的几个新坐标轴中。因此,我们可以忽略余下的坐标轴,即对数据进行了降维处理。
需要掌握的相关概率知识:协方差的意义和计算公式(包含均值、方差、标准差)
以上是关于主成成分分析-PCA(principal component annlysis)的主要内容,如果未能解决你的问题,请参考以下文章
R语言使用psych包的principal函数对指定数据集进行主成分分析PCA进行数据降维(输入数据为相关性矩阵)计算主成分评分系数每个样本(观察)的主成分得分由主成分分数系数构建的公式得到
主成分分析(Principal Component Analysis,PCA)与因子分析(factor analysis)
主成分分析(principal components analysis, PCA)
PCA(principal component analysis)主成分分析降维和KPCA(kernel principal component analysis)核