FP-TREE 算法,频繁项集与关联规则分析

Posted ChangCrazy

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了FP-TREE 算法,频繁项集与关联规则分析相关的知识,希望对你有一定的参考价值。

使用场景如:

用户频道属性分析 、用户忠诚度分析 、用户偏好路径分析、 用户偏好终端分析、 用户访问网站时间分析、 用户浏览内容分析

 

例子:一用户某次访问网站的路径示意图

                   

ABCD    ABEGH    ABEGW   AOU   AOV

Apriori算法

        需要扫描多个事物数据集,增加IO开销。会产生2的k次方频繁项集。

 

FP-Tree算法

概念: 树 链 节点 节点的前向路径 单支 多支 条件基

 


若Tree为单支,则输出整条单支和条件基BASE,支持度为单支中所有节点支持度的最小值。
 

  1. 若Tree为多支,先输出项表头HEAD中每项与条件基BASE的组合。然后,对于项表头中的每一项,取出该项在Tree中的所有前向路径,每条路径的基础支持度为该项的支持度。
  2. M条路径共M行数据,将这M行数据重新生成Tree,返回算法步骤-3中的1。

 


 

 

 

--->流程参考

以上是关于FP-TREE 算法,频繁项集与关联规则分析的主要内容,如果未能解决你的问题,请参考以下文章

关联规则之Apriori算法

关联规则—频繁项集Apriori算法

序列模式挖掘频繁项集与频繁序列

关联规则( Association Rules)之频繁模式树(FP-Tree)

第九章 数据关联规则分析算法——基于Apriori算法的关联项分析

关联分析的关联分析的方法