使用 PCA 时有监督学习和无监督学习的区别

Posted 2023-03-12

技术标签:

【中文标题】使用 PCA 时有监督学习和无监督学习的区别【英文标题】：The difference between supervised and unsupervised learning when using PCA 【发布时间】：2017-06-27 18:50:14 【问题描述】：

我已阅读答案here。但是，我无法将它应用到我的一个示例中，所以我可能仍然不明白。

这是我的例子：假设我的程序正在尝试学习 PCA（主成分分析）。或对角化过程。我有一个矩阵，答案是它的对角化：

A = PDP^-1

如果我理解正确：

在监督学习中我会尝试所有的错误

我的问题是：

我将在无监督学习中拥有什么？

在我进行试验时，每次试验都会出现错误，而不是提前出现所有错误吗？还是别的什么？

【问题讨论】：

What is the difference between supervised learning and unsupervised learning?的可能重复 【参考方案1】：

首先，PCA 既不用于分类，也不用于聚类。它是一种数据分析工具，您可以在其中找到数据中的主要成分。这可以用于例如降维。有监督和无监督的学习在这里没有关系。

但是，PCA 通常可以在使用学习算法之前应用于数据。

在监督学习中，您（如您所说）有一组带有“错误”的标记数据。

在无监督学习中，你没有任何标签，即，你根本无法验证任何东西。您所能做的就是以某种方式对数据进行聚类。目标通常是实现内部更同质的集群。可以使用集群内方差指标衡量成功，例如。

【讨论】：

但是集群有什么帮助呢？也许这两个集群集都不是 PCA 结果......我不明白仅仅聚类有什么意义...... @user135172 在谈论聚类分析时忘记 PCA，它是苹果和橘子。 聚类示例：假设您正在开发一个音乐推荐系统，并且您想要推荐具有相似品味的用户喜欢的音乐。然后，您可以根据他们的音乐偏好对所有用户进行聚类（例如，使用 DBSCAN）。然后，当要向单个用户推荐音乐时，您会呈现与所选用户相同的集群内的其他人喜欢的所有音乐。这是无监督学习。我明白了，是不是像间接系统？我的意思是，在这个音乐推荐的例子中，监督学习会是什么样子，它会是一个直接检查音乐类型而不是间接检查同群人的系统吗？这是有监督学习和无监督学习的区别吗？ @user135172 如果使用监督学习，我们可以把它变成一个分类问题。我们现在想要推荐与用户已经喜欢的音乐相似的音乐。如果我们将用户喜欢的音乐视为正面，而将所有其他音乐视为负面，那么我们就有一个可用于训练的标记集。现在，使用我们的训练集训练了一个分类器算法，今后将能够将任何音乐分类为正面或负面（喜欢或不喜欢）。这是监督学习。【参考方案2】：

监督学习：

-> 您提供各种标记的示例数据作为输入以及正确答案。

-> 该算法将学习它并开始根据输入预测正确的结果。

例子： email spam filter

无监督学习：

-> 你只给出了数据，没有说出标签或正确答案之类的东西。

-> 算法自动分析数据中的模式。

例子： google news

【讨论】：

以上是关于使用 PCA 时有监督学习和无监督学习的区别的主要内容，如果未能解决你的问题，请参考以下文章

机器学习一监督学习和无监督学习的区别 / 蓝讯