PCA-2 主成分与协方差矩阵的关系

Posted 丘文波

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了PCA-2 主成分与协方差矩阵的关系相关的知识,希望对你有一定的参考价值。

这篇博客主要介绍如何基于样本的协方差矩阵来求解样本的主成分。

1. 样本协方差矩阵

1.1 样本矩阵

假设对m维随机变量 x = ( x 1 , x 2 , ⋯   , x m ) T \\boldsymbol{x}=\\left(x_{1}, x_{2}, \\cdots, x_{m}\\right)^{\\mathrm{T}} x=(x1,x2,,xm)T进行n次独立观测, x _ 1 , x _ 2 , ⋯   , x _ n x\\_1, x\\_2, \\cdots, x\\_n x_1,x_2,,x_n表示观测样本,其中 x _ j = ( x 1 j , x 2 j , ⋯   , x m j ) T x\\_j=\\left(x_{1 j}, x_{2 j}, \\cdots, x_{m j}\\right)^{\\mathrm{T}} x_j=(x1j,x2j,,xmj)T表示j个观测样本, x i j x_{ij} xij表示第j个样本的第i个变量, j = 1 , 2 , ⋯   , n j=1,2, \\cdots, n j=1,2,,n

X = [ x _ 1 x _ 2 ⋯ x _ n ] = [ x 11 x 12 ⋯ x 1 n x 21 x 22 ⋯ x 2 n ⋮ ⋮ ⋮ x m 1 x m 2 ⋯ x m n ] X=\\left[\\begin{array}{llll} {x\\_1} & {x\\_2} & \\cdots & {x\\_n} \\end{array}\\right]=\\left[\\begin{array}{cccc} x_{11} & x_{12} & \\cdots & x_{1 n} \\\\ x_{21} & x_{22} & \\cdots & x_{2 n} \\\\ \\vdots & \\vdots & & \\vdots \\\\ x_{m 1} & x_{m 2} & \\cdots & x_{m n} \\end{array}\\right] X=[x_1x_2x_n]=x11x21xm1x12x22xm2x1nx2nxmn

观察到在实际问题中, 不同维度的变量可能有不同的量纲, 直接求主成分有时会产生不合理的 结果。为了消除这个影响,常常对各个维度的变量实施规范化, 使其均值为 0, 方差为 1 。

在使用样本主成分时,一般假设样本数据是规范化的,即对样本矩阵作如下变换:
x i j ∗ = x i j − x ˉ i s i i , i = 1 , 2 , ⋯   , m ; j = 1 , 2 , ⋯   , n x_{i j}^{*}=\\frac{x_{i j}-\\bar{x}_{i}}{\\sqrt{s_{i i}}}, \\quad i=1,2, \\cdots, m ; \\quad j=1,2, \\cdots, n xij=sii xijxˉi,i=1,2,,m;j=1,2,,n
其中
x ˉ i = 1 n ∑ j = 1 n x i j , i = 1 , 2 , ⋯   , m s i i = 1 n − 1 ∑ j = 1 n ( x i j − x ˉ i ) 2 , i = 1 , 2 , ⋯   , m \\begin{array}{l} \\bar{x}_{i}=\\frac{1}{n} \\sum_{j=1}^{n} x_{i j}, \\quad i=1,2, \\cdots, m \\\\ s_{i i}=\\frac{1}{n-1} \\sum_{j=1}^{n}\\left(x_{i j}-\\bar{x}_{i}\\right)^{2}, \\quad i=1,2, \\cdots, m \\end{array} xˉi=n1j=1nxij,i=1,2,,msii=n11j=1n(xijxˉi)2,i=1,2,,m

之前的样本矩阵变成为:
X = [ x _ 1 x _ 2 ⋯ x _ n ] = [ x 11 ∗ x 12 ∗ ⋯ x 1 n ∗ x 21 ∗ x 22 ∗ ⋯ x 2 n ∗ ⋮ ⋮ ⋮ x m 1 ∗ x m 2 ∗ ⋯ x m n ∗ ] X=\\left[\\begin{array}{llll} {x\\_1} & {x\\_2} & \\cdots & {x\\_n} \\end{array}\\right]=\\left[\\begin{array}{cccc} x_{11}^{*} & x_{12}^{*} & \\cdots & x_{1 n}^{*} \\\\ x_{21}^{*} & x_{22}^{*} & \\cdots & x_{2 n}^{*} \\\\ \\vdots & \\vdots & & \\vdots \\\\ x_{m 1}^{*} & x_{m 2}^{*} & \\cdots & x_{m n}^{*} \\end{array}\\right] X=[PCA-2 主成分与协方差矩阵的关系

主成分分析(PCA)数学原理详解

主成分分析(PCA)与线性判别分析(LDA)

SPSS分析中解释的总方差和旋转成分矩阵要怎么进行解释?就是说怎么对这个结果进行说明,然后写进论文里?

算法理解之主成分分析法

机器学习数据降维方法 PCA主成分分析