Hadoop 的 Apriori 和关联规则
Posted
技术标签:
【中文标题】Hadoop 的 Apriori 和关联规则【英文标题】:Apriori and association rules with Hadoop 【发布时间】:2011-11-26 13:24:09 【问题描述】:是否可以使用 map-reduce 创建 Apriori 应用程序?我刚开始,但不清楚如何根据之前的运行创建下一个候选集。有人有这方面的经验吗?
【问题讨论】:
是的,Apriori算法是可行的——生成频繁项集 【参考方案1】:看看 Apache Mahout 可能会很有用。它是 Java 中的机器学习和数据挖掘框架,抽象了发送 MapReduce 作业以用于聚类、推荐和分类任务。
似乎没有实现先验算法(有一个标记为无法修复的 jira 问题:https://issues.apache.org/jira/browse/MAHOUT-108),但也许其他算法可能对您有用。
即使您只需要先验算法,查看他们的源代码以获得一些想法也会很有用。
【讨论】:
但是我不知道怎么用。除了pitch之外没有任何源代码....还有其他信息吗?以上是关于Hadoop 的 Apriori 和关联规则的主要内容,如果未能解决你的问题,请参考以下文章
第九章 数据关联规则分析算法——基于Apriori算法的关联项分析