无监督学习算法-Apriori进行关联分析

Posted xiaogangfan

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了无监督学习算法-Apriori进行关联分析相关的知识,希望对你有一定的参考价值。

关联分析

是无监督讯息算法中的一种,Apriori主要用来做_关联分析_,_关联分析_可以有两种形式:频繁项集或者关联规则。举个例子:交易订单

序号 商品名称
1 书籍,电脑
2 杯子,手机,手机壳,盘子
3 古筝,手机,手机壳,玻璃
4 手机,玻璃
5 电视,手机,手机壳

频繁项集:{ 古筝,手机,手机壳,玻璃}就是一个例子。
关联规则:手机->手机壳,买手机很大概率会买手机壳。

关联分析使用的思路

  • 无论是频繁项集还是关联规则,都是需要看发生的频率,比如有手机就有手机壳的概率,如果这个比率超过了75%,那么符合。那么概率手机->手机壳=概率({手机、手机壳})/概率({手机})=
    3/5 除以 4/5 = 0.75。
  • 上面的只是其中一种组合,理论上要计算所有排列组合的概率,所以随着数据量的增大,计算量指数增长,而Apriori算法的思路就是如何减少计算量

Apriori的原理

命题:假设一个项集是非频繁的,那么该项集的包含者也是非频繁的。
TODO

优缺点和场景

  • 优点:编码容易
  • 缺点:大数据量时间可能会唱
  • 试用:数值型 or 标称型数据



以上是关于无监督学习算法-Apriori进行关联分析的主要内容,如果未能解决你的问题,请参考以下文章

2019-07-31机器学习无监督学习之降维PCA算法实例 (鸢尾花)

2019-07-31机器学习无监督学习之聚类 K-Means算法实例 (图像分割)

2019-07-25机器学习无监督学习之聚类 K-Means算法实例 (1999年中国居民消费城市分类)

Apriori算法与FP-growth算法

无监督学习之RBM和AutoEncoder

无监督学习之RBM和AutoEncoder