为啥关联规则学习被认为是一种监督学习方法?

Posted

技术标签:

【中文标题】为啥关联规则学习被认为是一种监督学习方法?【英文标题】:Why is Association rule learning considered a supervised learning approach?为什么关联规则学习被认为是一种监督学习方法? 【发布时间】:2017-09-20 01:36:58 【问题描述】:

有人可以向我解释一下,为什么关联规则学习被认为是一种监督学习方法?我的理解是该算法采用一堆连贯的数据集并根据这些集计算关联:

a, b, c
a, b, d
=> a -> b
=> b -> a

在我看来,只有任意数据集。没有特定的目标载体。为什么这叫做有监督?

【问题讨论】:

谁说它是有监督的?我知道的所有来源都认为它是无监督的,因为没有目标标签。 ***将其列为监督学习方法。我也做了一些谷歌搜索,将其分类的 2-3 个来源也将其列为受监督的。它也让我觉得很奇怪,因为它没有目标标签。我认为它可能会隐含地将包含集的其他成员分配为标签,使其成为一种受监督的算法,但由于没有记录在任何地方,我想我可能会在这里问。 他们可能只是从 Wikipedia 复制了这个有问题的声明...... :-) 【参考方案1】:

如果有人将Association rule learning 视为unsupervisedsupervised learning task,我想这是一个公开讨论。而Wikipedia 将其计入监督学习算法组other resources 将其计入无监督学习算法类:

与决策树和规则集归纳相反,这会导致 分类模型,关联规则学习是一种无监督的 学习方法,没有为示例分配类标签。

机器学习和数据挖掘 - Springer

我想这取决于实际的学习部分是如何实施的。可以创建 training data - label 对的数据集,例如在您的示例中:

a, b, c
a, b, d
=> a -> b
=> b -> a

拥有数百或数千个这样的对,可以训练神经网络以相当高的准确度理解数据集中的底层模式,正如我所想的那样。这将是一个Supervised Learning task,NN 从预分类示例中学习。

另一方面,如果算法以这样一种方式实现,即基于以下条件计算关联:Support - Confidence - Lift - Conviction 它将是Unsupervised Learning task

【讨论】:

以上是关于为啥关联规则学习被认为是一种监督学习方法?的主要内容,如果未能解决你的问题,请参考以下文章

无监督学习算法-Apriori进行关联分析

无监督学习

关联规则-算法原理与案例

机器学习算法:关联规则分析

机器学习算法:关联规则分析

为啥 t-sne 被认为是有监督的?