机器学习保研复习

Posted 2023-03-10 miss9785

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了机器学习保研复习相关的知识，希望对你有一定的参考价值。

PCA：主成分分析（无监督）

PCA（Principal Component Analysis）是一种常用的数据降维技术，用于将多维数据集投影到低维空间中，同时保留数据的重要信息。PCA 的目标是在保持最大方差的同时，找到最佳的线性组合来表示数据。

以下是 PCA 的详细步骤：

1.数据标准化

在应用 PCA 之前，需要将数据标准化，使得每个特征的平均值为 0，方差为 1。这是因为 PCA 是基于方差计算的，如果某个特征的方差值过大，将会对结果产生较大的影响。

2.计算协方差矩阵

协方差矩阵反映了不同特征之间的相关性。通过计算协方差矩阵，可以找到数据中的主要方向。

3.计算特征值和特征向量（除了基于特征值分解，还可以SVD分解）

协方差矩阵的特征向量代表了数据的主要方向，特征值代表了数据在该方向上的重要性。通过计算协方差矩阵的特征值和特征向量，可以得到数据的主成分。

4.选择主成分

选择主成分的方法通常是基于特征值的大小。将特征值从大到小排序，选择前 k 个主成分，使得它们可以解释数据中的大部分方差。

5.计算投影矩阵

投影矩阵是将数据从高维空间投影到低维空间的矩阵。它的列向量是选择的主成分。

6.将数据投影到低维空间

通过将数据乘以投影矩阵，可以将数据投影到低维空间。在新的低维空间中，数据的每个样本可以表示为一个 k 维向量，其中 k 是选择的主成分的数量。

PCA 是一种非常有用的数据降维技术，可以帮助我们在保留数据重要信息的同时，减少数据的维度。在机器学习和数据分析中，PCA 经常被用作数据预处理步骤，以减少计算量并提高模型的效率。

SVD奇异值分解

SVD（Singular Value Decomposition）分解是一种常用的矩阵分解方法，可以将一个 m×n 的矩阵 A 分解为三个矩阵的乘积：U、S 和 V^T。其中，U 和 V^T 是正交矩阵，S 是对角矩阵。SVD 分解可以用于数据降维、矩阵压缩和矩阵近似等方面。

以下是 SVD 分解的详细步骤：

1.给定一个 m×n 的矩阵 A

2.计算 A^T × A 的特征值和特征向量

由于 A^T × A 是一个对称矩阵，因此可以计算它的特征值和特征向量。特征值按照从大到小的顺序排列，特征向量也相应地排列。

3.计算 V 矩阵

将 A^T × A 的特征向量作为 V 矩阵的列向量。由于特征向量是正交的，因此 V 是一个正交矩阵。

4.计算 A × A^T 的特征值和特征向量

同样地，可以计算 A × A^T 的特征值和特征向量。特征值按照从大到小的顺序排列，特征向量也相应地排列。

5.计算 U 矩阵

将 A × A^T 的特征向量作为 U 矩阵的列向量。由于特征向量是正交的，因此 U 是一个正交矩阵。

6.计算对角矩阵 S

对角矩阵 S 的对角线元素是 A × A^T 或 A^T × A 的特征值的平方根。由于特征值已按从大到小的顺序排列，因此对角线上的元素也应按相同的顺序排列。

7.重构原始矩阵

可以使用 U、S 和 V^T 重构原始矩阵。原始矩阵可以表示为 A = U × S × V^T。

SVD 分解的应用非常广泛，特别是在机器学习、数据挖掘和图像处理等领域。例如，在图像处理中，可以使用 SVD 分解将图像压缩为更小的矩阵，以便更轻松地存储和传输。在机器学习中，SVD 分解可以用于数据降维

SVM支持向量机

【机器学习】支持向量机 SVM（非常详细） - 知乎 (zhihu.com)

SVM 为什么要从原始问题变为对偶问题来求解

1.首先是我们有不等式约束方程，这就需要我们写成min max的形式来得到最优解。而这种写成这种形式对x不能求导，这种形式只能对a求导，所以我们需要转换成max min的形式，这时候，x就在里面了，这样就能对x求导了。而为了满足这种对偶变换成立，就需要满足KKT条件（KKT条件是原问题与对偶问题等价的必要条件，当原问题是凸优化问题时，变为充要条件）。

2.对偶问题将原始问题中的约束转为了对偶问题中的等式约束

3.方便核函数的引入

3. 改变了问题的复杂度。由求特征向量w转化为求比例系数a，在原始问题下，求解的复杂度与样本的维度有关，即w的维度。在对偶问题下，只与样本数量有关。