关联规则分析-apriori

Posted stacey999999

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了关联规则分析-apriori相关的知识,希望对你有一定的参考价值。

í一、概念

1、支持度support:数据集中A、B同时出现的频率,即 P(AB) = Freq(AB) / N

2、置信度confidence:在A出现的条件下,B出现的频率,即 置信度P(A->B) = Freq(AB) / Freq(A) 

3、提升度lift:left = 支持度(AB) / 支持度(A) * 支持度(B)

      注:提升度反应了关联规则中的A与B的相关性,提升都>1 且越高表明正相关性越高,提升度<1且越低表明负相关性越高,提升度=1表明没有相关性。

例如:A和B的关联规则的支持度是0.2,A出现的支持度是0.3,B出现的支持度是0.5,则提升度是 1.33>1,表明 ”A -> B“ 规则对于B的出现有提升效果

4、频繁项集:满足最小支持度要求的项集。

5、关联规则:表示两个物品之间,存在很强的关系

6、性质:

    a、如果某个项集是频繁的,那么它的所有子集也是频繁的

    b、如果某个项集是非频繁的,那么它的所有超集也是非频繁的

    c、Apriori算法从单元素项集开始,通过满足最小支持度的项集来形成更大的集合

以上是关于关联规则分析-apriori的主要内容,如果未能解决你的问题,请参考以下文章

使用Apriori进行关联分析

Python中的Apriori关联算法-市场购物篮分析

关联规则算法(The Apriori algorithm)

Python 实现关联规则分析Apriori算法

机器学习算法关联规则-1 关联规则的概念,Apriori算法,实例和优缺点

关联算法