Hadoop 的 Apriori 和关联规则

Posted

技术标签:

【中文标题】Hadoop 的 Apriori 和关联规则【英文标题】:Apriori and association rules with Hadoop 【发布时间】:2011-11-26 13:24:09 【问题描述】:

是否可以使用 map-reduce 创建 Apriori 应用程序?我刚开始,但不清楚如何根据之前的运行创建下一个候选集。有人有这方面的经验吗?

【问题讨论】:

是的,Apriori算法是可行的——生成频繁项集 【参考方案1】:

看看 Apache Mahout 可能会很有用。它是 Java 中的机器学习和数据挖掘框架,抽象了发送 MapReduce 作业以用于聚类、推荐和分类任务。

似乎没有实现先验算法(有一个标记为无法修复的 jira 问题:https://issues.apache.org/jira/browse/MAHOUT-108),但也许其他算法可能对您有用。

即使您只需要先验算法,查看他们的源代码以获得一些想法也会很有用。

【讨论】:

但是我不知道怎么用。除了pitch之外没有任何源代码....还有其他信息吗?

以上是关于Hadoop 的 Apriori 和关联规则的主要内容,如果未能解决你的问题,请参考以下文章

关联规则中Apriori演算法的一个小问题

第九章 数据关联规则分析算法——基于Apriori算法的关联项分析

机器学习算法关联规则-1 关联规则的概念,Apriori算法,实例和优缺点

关联规则之Apriori算法

关联规则算法(The Apriori algorithm)

使用Apriori进行关联分析