关于数据挖掘中的apriori算法,帮忙推出关联规则 事务数为 5 支持度为0.6,置信度为0.6
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了关于数据挖掘中的apriori算法,帮忙推出关联规则 事务数为 5 支持度为0.6,置信度为0.6相关的知识,希望对你有一定的参考价值。
所选项集: abc acde bcdf abcd abcdf
候选集1: a b c d e f
频繁集1: a b c d
候选集2: ab ac ad bc bd cd
频繁集2: ab ac ad bc bd cd
候选集3: abc abd acd bcd
频繁集3: abc acd bcd
候选集4: abcd
频繁集4:
最大频繁项集:abc acd bcd
关联规则:
1) 对于每个频繁项集L,产生L的所有非空真子集。
2) 对于L的每个非空真子集 ,如果L的支持计数除以 的支持计数大于等于最小置信度阈值min_conf,则输出强关联规则 =>(L- )。
例如:abc的非空真子集有a,b,c,ab,ac,bc。分别算出他们的支持数,再除以abc的支持数,若结果大于0.6则可输出强关联规则。Pa/P1=4/3>0.6,则可以输出关联规则:a=>bc;同理可输出强关联规则:b=>ac,c=>ab;
同理,对于acd,bcd采用同样地方法。 参考技术A 对于每个频繁项集X,有非空子集Y,如果support(X)/support(Y)>=0.6(置信度阈值),那么输出规则X->(X-Y)
给你举个例子:
abc,有非空子集ac,support(acb)/support(ac)=3/4=0.75>=0.6,那么输出规则abc->b
建议你写程序做吧。
以上是我的理解,希望对你有用~
以上是关于关于数据挖掘中的apriori算法,帮忙推出关联规则 事务数为 5 支持度为0.6,置信度为0.6的主要内容,如果未能解决你的问题,请参考以下文章