使用 Python 进行 PCA 分析和绘图

Posted

技术标签:

【中文标题】使用 Python 进行 PCA 分析和绘图【英文标题】:PCA Analysis and Plotting with Python [duplicate] 【发布时间】:2012-11-20 02:21:28 【问题描述】:

可能重复:PCA Analysis with Python

我有这个data,它的尺寸是 1940 x 4。它的行是读数或样本,而它的列是变量(温度、湿度、风速和压力)。我想进行 PCA 分析并使用 Python 绘制其结果。情况是,我最终得到了一些技术和示例,但我不确定如何利用它们以及即使我得到 PCA 结果该做什么。所以,我在这里寻找一个代码示例,通过它我可以在这种数据集上用 Python 实现 PCA 分析,以及了解如何解释 PCA 结果以及如何绘制它们。最后,如何解释图。非常感谢。

【问题讨论】:

***.com/questions/1730600/… E 先生的评论应该会有所帮助。此外,您的previous question 似乎得到了一些非常可靠的答案(我不确定这个问题有什么不同。) 我看过这个例子..它说这就是你如何绘制你的 PCA..我需要知道我应该如何绘制以及在 PCA 结果中绘制什么以及如何正确解释它们..:( 你想要PCA做什么,因为你的数据只有4维,你还想减少维度吗? 确保在某些纯文本编辑器中打开数据文件,在 excel 中的 b/c 看起来很吓人。 【参考方案1】:

主成分分析对于降低数据集的维度很有用。由于您的数据仅包含四个变量并且(据我所知)它们不相关,因此我不希望 PCA 对任何实际分析有价值。

如果我错了,并且您真诚地期望某些变量是相关的,您可以使用 PCA 来识别捕获大部分典型协方差的最重要的 4 向量。这些是协方差矩阵的特征向量。需要四个这样的向量才能完全跨越与输入变量相同的空间。

在测量大量变量且存在大量相互信息的系统中,PCA 可识别独立信息的重要位。我认为您的系统不是这种情况。

【讨论】:

以上是关于使用 Python 进行 PCA 分析和绘图的主要内容,如果未能解决你的问题,请参考以下文章

Python进阶(三十九)-数据可视化の使用matplotlib进行绘图分析数据

Python使用Python进行主成分分析

带有 Python 的 PCA:特征向量不是正交的

Python中缺少值的PCA

03_Python 使用Matplotlib绘图

使用 PCA 进行图像分析/特征提取