使用 PCA 时有监督学习和无监督学习的区别

Posted

技术标签:

【中文标题】使用 PCA 时有监督学习和无监督学习的区别【英文标题】:The difference between supervised and unsupervised learning when using PCA 【发布时间】:2017-06-27 18:50:14 【问题描述】:

我已阅读答案here。但是,我无法将它应用到我的一个示例中,所以我可能仍然不明白。

这是我的例子: 假设我的程序正在尝试学习 PCA(主成分分析)。 或对角化过程。 我有一个矩阵,答案是它的对角化:

A = PDP-1

如果我理解正确:

监督学习中我会尝试所有的错误

我的问题是:

我将在无监督学习中拥有什么?

在我进行试验时,每次试验都会出现错误,而不是提前出现所有错误吗?还是别的什么?

【问题讨论】:

What is the difference between supervised learning and unsupervised learning?的可能重复 【参考方案1】:

首先,PCA 既不用于分类,也不用于聚类。它是一种数据分析工具,您可以在其中找到数据中的主要成分。这可以用于例如降维。有监督和无监督的学习在这里没有关系。

但是,PCA 通常可以在使用学习算法之前应用于数据。

在监督学习中,您(如您所说)有一组带有“错误”的标记数据。

无监督学习中,你没有任何标签,,你根本无法验证任何东西。您所能做的就是以某种方式对数据进行聚类。目标通常是实现内部更同质的集群。可以使用集群内方差指标衡量成功,例如

【讨论】:

但是集群有什么帮助呢?也许这两个集群集都不是 PCA 结果......我不明白仅仅聚类有什么意义...... @user135172 在谈论聚类分析时忘记 PCA,它是苹果和橘子。 聚类示例:假设您正在开发一个音乐推荐系统,并且您想要推荐具有相似品味的用户喜欢的音乐。然后,您可以根据他们的音乐偏好对所有用户进行聚类(例如,使用 DBSCAN)。然后,当要向单个用户推荐音乐时,您会呈现与所选用户相同的集群内的其他人喜欢的所有音乐。这是无监督学习。 我明白了,是不是像间接系统?我的意思是,在这个音乐推荐的例子中,监督学习会是什么样子,它会是一个直接检查音乐类型而不是间接检查同群人的系统吗?这是有监督学习和无监督学习的区别吗? @user135172 如果使用监督学习,我们可以把它变成一个分类问题。我们现在想要推荐与用户已经喜欢的音乐相似的音乐。如果我们将用户喜欢的音乐视为正面,而将所有其他音乐视为负面,那么我们就有一个可用于训练的标记集。现在,使用我们的训练集训练了一个分类器算法,今后将能够将任何音乐分类为正面或负面(喜欢或不喜欢)。这是监督学习。【参考方案2】:

监督学习:

-> 您提供各种标记的示例数据作为输入以及正确答案。

-> 该算法将学习它并开始根据输入预测正确的结果。

例子: email spam filter


无监督学习:

-> 你只给出了数据,没有说出标签或正确答案之类的东西。

-> 算法自动分析数据中的模式。

例子: google news

【讨论】:

以上是关于使用 PCA 时有监督学习和无监督学习的区别的主要内容,如果未能解决你的问题,请参考以下文章

机器学习 一 监督学习和无监督学习的区别 / 蓝讯

机器学习的监督学习和无监督学习的区别?

有监督和无监督

无监督和有监督的区别

有监督学习和无监督学习

监督学习和无监督学习