有监督和无监督

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了有监督和无监督相关的知识,希望对你有一定的参考价值。

参考技术A 1).监督式算法:

    具有一个标准的本体,算法通过学习对数据进行预测,从而与本体进行比较。(我知道我想要得到什么)对数据,一部分数据用于训练模型,另一部分用于比较模型的正确率,有多少的匹配度就是多少的正确率。

  2).无监督式算法:

    不具有标准的本体,对于数据量庞大的数据集,我们想要找到其中隐藏的一些关系,则采用无监督式算法。需要将数据转化为一种有意义可比较的格式,最终得到的会是具有一定关系的集合。但是是否是我们想要的集合取决于我们自己。可以进行强制的删减某些数据以达到我们预期的特定分割。

  3).强化式算法:

   研究试图对强化学习模型进行逆向反馈以改进问题和技术的一种算法。是一种延时的机制。是一个连续做决策的过程,在一个过程中输入的数据的返回值会影响到下一个输入数据的返回值。算法定义了reward,由于自己能够察觉到signal并进行自己定义的action,算法需要将结果与reward进行比较,最终反馈以改进模型。RL没有被严格地监督,因为它不严格地依赖于受监督(或标记)数据集(训练集)。它实际上依赖于能够监控所采取行动的反应,并根据对奖励的定义来衡量。但这也不是没有监督的学习,因为我们知道,当我们对学习者进行建模时,这就是预期的回报。

使用 PCA 时有监督学习和无监督学习的区别

【中文标题】使用 PCA 时有监督学习和无监督学习的区别【英文标题】:The difference between supervised and unsupervised learning when using PCA 【发布时间】:2017-06-27 18:50:14 【问题描述】:

我已阅读答案here。但是,我无法将它应用到我的一个示例中,所以我可能仍然不明白。

这是我的例子: 假设我的程序正在尝试学习 PCA(主成分分析)。 或对角化过程。 我有一个矩阵,答案是它的对角化:

A = PDP-1

如果我理解正确:

监督学习中我会尝试所有的错误

我的问题是:

我将在无监督学习中拥有什么?

在我进行试验时,每次试验都会出现错误,而不是提前出现所有错误吗?还是别的什么?

【问题讨论】:

What is the difference between supervised learning and unsupervised learning?的可能重复 【参考方案1】:

首先,PCA 既不用于分类,也不用于聚类。它是一种数据分析工具,您可以在其中找到数据中的主要成分。这可以用于例如降维。有监督和无监督的学习在这里没有关系。

但是,PCA 通常可以在使用学习算法之前应用于数据。

在监督学习中,您(如您所说)有一组带有“错误”的标记数据。

无监督学习中,你没有任何标签,,你根本无法验证任何东西。您所能做的就是以某种方式对数据进行聚类。目标通常是实现内部更同质的集群。可以使用集群内方差指标衡量成功,例如

【讨论】:

但是集群有什么帮助呢?也许这两个集群集都不是 PCA 结果......我不明白仅仅聚类有什么意义...... @user135172 在谈论聚类分析时忘记 PCA,它是苹果和橘子。 聚类示例:假设您正在开发一个音乐推荐系统,并且您想要推荐具有相似品味的用户喜欢的音乐。然后,您可以根据他们的音乐偏好对所有用户进行聚类(例如,使用 DBSCAN)。然后,当要向单个用户推荐音乐时,您会呈现与所选用户相同的集群内的其他人喜欢的所有音乐。这是无监督学习。 我明白了,是不是像间接系统?我的意思是,在这个音乐推荐的例子中,监督学习会是什么样子,它会是一个直接检查音乐类型而不是间接检查同群人的系统吗?这是有监督学习和无监督学习的区别吗? @user135172 如果使用监督学习,我们可以把它变成一个分类问题。我们现在想要推荐与用户已经喜欢的音乐相似的音乐。如果我们将用户喜欢的音乐视为正面,而将所有其他音乐视为负面,那么我们就有一个可用于训练的标记集。现在,使用我们的训练集训练了一个分类器算法,今后将能够将任何音乐分类为正面或负面(喜欢或不喜欢)。这是监督学习。【参考方案2】:

监督学习:

-> 您提供各种标记的示例数据作为输入以及正确答案。

-> 该算法将学习它并开始根据输入预测正确的结果。

例子: email spam filter


无监督学习:

-> 你只给出了数据,没有说出标签或正确答案之类的东西。

-> 算法自动分析数据中的模式。

例子: google news

【讨论】:

以上是关于有监督和无监督的主要内容,如果未能解决你的问题,请参考以下文章

有监督学习和无监督学习的区别

有监督学习和无监督学习

有监督和无监督的特征选择方法

WEKA 中的有监督和无监督重采样有啥区别?

有监督学习和无监督学习

有监督学习和无监督学习算法怎么理解?