机器学习:PCA(高维数据映射为低维数据 封装&调用)

Posted volcao

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习:PCA(高维数据映射为低维数据 封装&调用)相关的知识,希望对你有一定的参考价值。

# 每个主成分向量的长度与数据集的特征数一样

# 主成分分析法的本质:将数据集从一个坐标系转换到另一个坐标系,原坐标系有 n 个维度(n 中特征),则转换的新坐标系也有 n 个维度,每个主成分表示一个维度,只是对于转换后的坐标系,只取前 k 个维度(也就是前 k 个主成分),此 k 个维度相对于数据集更加重要,形成矩阵 Wk

技术分享图片

# 将 n 维特征空间转换为 k 维(此为降维的过程):

  原则:将 n 维的样本数据转换为 k 维的数据

  操作:将数据集 X 的一个 n 维样本,与矩阵 Wk 相乘,得到一个 k 维数据;

 

# 将 n 维数据集 X 降维为 k 维数据 Xk:X . WkT = Xk

技术分享图片

 

# 将降维后的 k 维数据 Xk 恢复到 n 维数据 Xm :Xk . Wk = Xm

  # 注:恢复后的数据集 X 已经不是原始的数据集了,因为在前期降维的过程回丢失原始数据集的信息,恢复数据集时,丢失的信息无法恢复;

 

# Xm 与原始数据 X 的区别:

 

以上是关于机器学习:PCA(高维数据映射为低维数据 封装&调用)的主要内容,如果未能解决你的问题,请参考以下文章

机器学习Sklearn库主成分分析PCA降维的运用实战

机器学习算法笔记6. 降维与主分量分析(PCA)

主成分分析法

四大机器学习降维算法:PCALDALLELaplacian Eigenmaps

Stanford机器学习笔记12-Dimensionality Reduction

PCA算法原理及实现