Python遥感数据主成分分析

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python遥感数据主成分分析相关的知识,希望对你有一定的参考价值。

  原文:http://www.cnblogs.com/leonwen/p/5158947.html

 

  该算法由MatLab移植而来(具体参见上一篇博文)。但是最终输出结果却和MatLab不一致,经排查发现在进行调用两者内部函数eig进行求解特征值和特征向量的时候,两者特征值都一致,但是特征向量却不同。

  可是,从理论上感觉也说得过去,因为特征向量本来就具有不唯一性。最让人费解的是,就算两者特征向量不一致,可为什么使用PCA的结果却反差很大呢?感觉上来看,好像是Python的不准确行更大一点。

  代码如下:

# -*- coding: utf-8 -*-
"""
Created on Tue Jan 12 21:45:57 2016

@author: 文核
""" import os from PIL import Image from numpy import * from pylab import * path = rD:\\Projects\\PythonProj\\ImageProcessing\\2012 sst_dir = os.listdir(path) file_len = len(sst_dir) sst_list = [] for i in range(file_len): str = path + \\\\ + sst_dir[i] #txt = open(str).read() sst_list.append(str) immatrix = [] for im in sst_list: text = loadtxt(im) immatrix.append(text) immatrix = array(immatrix) # 显示输出 figure() gray() for i in range(file_len): subplot(3,4,i + 1) pic = immatrix[i].reshape(180,360) pic = pic[::-1] # picshow = rot90(pic,4) imshow(pic) colorbar() show() # 转换成样本总体 X = immatrix.T # 获取要本大小 m,n = X.shape[0:2] # 取得各个样本均值 meanVal = mean(X,axis = 0) #tempMean = tile(meanVal,(64800,1)) # 样本矩阵去中心化 X = X - tile(meanVal,(64800,1)) # 计算协方差 S = dot(X.T,X) / (m - 1) # 计算特征值eg和特征向量Ev eg,Ev = linalg.eig(S) #eg1,Ev1 = linalg.eigh(S) # 这两种算法存在排序区别,eigh返回结果由小到大 # 计算新的成分 Y = dot(immatrix.T,Ev) figure() gray() for i in range(n): subplot(3,4,i + 1) out = Y[:,i] outpic = out.reshape(180,360) outpic = outpic[::-1] imshow(outpic) colorbar() show()

  结果显示:

技术分享

 

原始数据显示

技术分享

PCA主成分分析结果输出

  可能是我自己的原因吧,正在排查,哪位大神指导还望课指导鄙人一下~先就此谢过~O(∩_∩)O~

以上是关于Python遥感数据主成分分析的主要内容,如果未能解决你的问题,请参考以下文章

数学建模MATLAB应用实战系列(八十七)-主成分分析法(附MATLAB和Python代码)

PCA主成分分析Python实现

05-05 主成分分析代码(手写数字识别)

机器学习:主成分分析PCA降维_Python

[python机器学习及实践]Sklearn实现主成分分析(PCA)

机器学习之路:python 特征降维 主成分分析 PCA