频繁项集?关联规则?支持度?置信度?

Posted litstar

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了频繁项集?关联规则?支持度?置信度?相关的知识,希望对你有一定的参考价值。

项集:

最基本的模式是项集,它是指若干个项的集合。频繁模式是指数据集中频繁出现的项集、序列或子结构。频繁项集是指支持度大于等于最小支持度(min_sup)的集合。其中支持度是指某个集合在所有事务中出现的频率。频繁项集的经典应用是购物篮模型。常用的频繁项集的评估标准有支持度,置信度和提升度(关联规则)三个

关联规则:

关联规则是形如X→Y的蕴涵式,其中, X和Y分别称为关联规则的先导(antecedent或left-hand-side, LHS)和后继(consequent或right-hand-side, RHS) 。其中,关联规则XY,存在支持度和信任度。

  支持度:几个关联的数据在数据集中出现的次数占总数据集的比重

  技术图片

  置信度:一个数据出现后,另一个数据出现的概率,或者说数据的条件概率。

  技术图片

  提升度:表示含有Y的条件下,同时含有X的概率,与X总体发生的概率之比

  技术图片

 技术图片

 自连接:

技术图片

 

以上是关于频繁项集?关联规则?支持度?置信度?的主要内容,如果未能解决你的问题,请参考以下文章

python实现apriori算法的关联规则之支持度置信度提升度

python实现apriori算法的关联规则之支持度置信度提升度

关联规则概念啤酒加尿布引出购物篮分析频繁项集支持度+置信度+提升度

R语言使用apriori算法进行关联规则挖掘实战:关联规则概念频繁项集支持度(support)置信度(confidence)提升度(lift)apriori算法

发现频繁项集的方法 Apriori算法

用关联算法做协同过滤: