序列模式挖掘频繁项集与频繁序列

Posted Data+Science+Insight

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了序列模式挖掘频繁项集与频繁序列相关的知识,希望对你有一定的参考价值。

 

GSP,Spade,FreeSpan,PrefixSpan都是频繁序列挖掘算法

关联规则挖掘的的目标是寻找达到某种程度联系的事物集合,再由其产生相关的关联规则。它并不考虑事物发生的先后顺序。

                                         

序列模式挖掘,就是从一个数据序列(Data Sequence)集合S中找出所有满足用户指定最小支持度的序列。每个这样的序列称为一个频繁序列,或者序列模式。可以看出,序列模式挖掘类似于Apriori算法中的频繁项目集挖掘是类似的,而且你接下来就会发现,帮助我们实现序列模式挖掘的GSP算法和频繁项目集挖掘的算法十分接近,如果你已经理解了频繁项目集挖掘算法,那么就可以很容理解GSP算法。

序列模式挖掘是指从序列数据库中寻找频繁子序列作为模式的知识发现过程,即输入一个序列数据库,输出所有不小于最小支持度的序列的过程。它有广泛的应用领域:预测用户购买行为、预测Web访问模式、预测天气变化、预测时长趋势。

以上是关于序列模式挖掘频繁项集与频繁序列的主要内容,如果未能解决你的问题,请参考以下文章

关联规则—频繁项集Apriori算法

用关联算法做协同过滤:

手推FP-growth (频繁模式增长)算法------挖掘频繁项集

频繁项集?关联规则?支持度?置信度?

推荐系统_关联规则挖掘

FP-TREE 算法,频繁项集与关联规则分析