FP-TREE 算法,频繁项集与关联规则分析
Posted ChangCrazy
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了FP-TREE 算法,频繁项集与关联规则分析相关的知识,希望对你有一定的参考价值。
使用场景如:
用户频道属性分析 、用户忠诚度分析 、用户偏好路径分析、 用户偏好终端分析、 用户访问网站时间分析、 用户浏览内容分析
例子:一用户某次访问网站的路径示意图
ABCD ABEGH ABEGW AOU AOV
Apriori算法
需要扫描多个事物数据集,增加IO开销。会产生2的k次方频繁项集。
FP-Tree算法
概念: 树 链 节点 节点的前向路径 单支 多支 条件基
若Tree为单支,则输出整条单支和条件基BASE,支持度为单支中所有节点支持度的最小值。
- 若Tree为多支,先输出项表头HEAD中每项与条件基BASE的组合。然后,对于项表头中的每一项,取出该项在Tree中的所有前向路径,每条路径的基础支持度为该项的支持度。
- M条路径共M行数据,将这M行数据重新生成Tree,返回算法步骤-3中的1。
--->流程参考
以上是关于FP-TREE 算法,频繁项集与关联规则分析的主要内容,如果未能解决你的问题,请参考以下文章
关联规则( Association Rules)之频繁模式树(FP-Tree)