关联规则分析-apriori
Posted stacey999999
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了关联规则分析-apriori相关的知识,希望对你有一定的参考价值。
í一、概念
1、支持度support:数据集中A、B同时出现的频率,即 P(AB) = Freq(AB) / N
2、置信度confidence:在A出现的条件下,B出现的频率,即 置信度P(A->B) = Freq(AB) / Freq(A)
3、提升度lift:left = 支持度(AB) / 支持度(A) * 支持度(B)
注:提升度反应了关联规则中的A与B的相关性,提升都>1 且越高表明正相关性越高,提升度<1且越低表明负相关性越高,提升度=1表明没有相关性。
例如:A和B的关联规则的支持度是0.2,A出现的支持度是0.3,B出现的支持度是0.5,则提升度是 1.33>1,表明 ”A -> B“ 规则对于B的出现有提升效果
4、频繁项集:满足最小支持度要求的项集。
5、关联规则:表示两个物品之间,存在很强的关系
6、性质:
a、如果某个项集是频繁的,那么它的所有子集也是频繁的
b、如果某个项集是非频繁的,那么它的所有超集也是非频繁的
c、Apriori算法从单元素项集开始,通过满足最小支持度的项集来形成更大的集合
以上是关于关联规则分析-apriori的主要内容,如果未能解决你的问题,请参考以下文章