机器学习实战精读--------Apriori算法

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习实战精读--------Apriori算法相关的知识,希望对你有一定的参考价值。

关联分析(关联规则学习):从大规模数据集中寻找物品间的隐含关系,

Apriori算法:一种挖掘关联规则的频繁项算法,其核心是通过候选集生成和情节的向下封闭检测ll阶段来挖掘频繁项集,它是最具影响的挖掘布尔关联规则频繁集的算法

Aprior算法缺点:① 可能产生大量候选集;② 可能需要重复扫描数据库。

频繁项集:经常出现在一块的物品的集合

关联规则暗示两种物品之间可能存在很强的关系

一个项集的支持度:数据集中包含该项集的记录所占的比例;支持度是针对项集来说的。

可信度(置信度)针对一条诸如{尿布}-》{葡萄酒}的关联规则来定义的,这条规则的可信度可以被定义为“支持度({尿布,葡萄酒})/支持度({尿布})”

支持度和可信度是用来量化关联分析是否成功的方法

Apriori原理:如果说某个项集是频繁的,那么它的所有子集也是频繁的;如果一个项集是非频繁的,anemia它的所有超集也是非频繁的。使用该原理可以避免项集数目的指数增长,从而在合理的时间内计算出频繁项集。

本文出自 “付炜超” 博客,谢绝转载!

以上是关于机器学习实战精读--------Apriori算法的主要内容,如果未能解决你的问题,请参考以下文章

机器学习实战精读--------K-近邻算法

《机器学习实战》 书上的Apriori算法 内循环为啥只执行了一次

apriori算法的代码,python实现,参考《机器学习实战》

机器学习实战精读--------决策树

机器学习实战第11章——使用 Apriori 算法进行关联分析

《机器学习实战》使用Apriori算法和FP-growth算法进行关联分析(Python版)