R语言应用实战系列-Apriori算法的相关内容(附案例源代码)
Posted 文宇肃然
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言应用实战系列-Apriori算法的相关内容(附案例源代码)相关的知识,希望对你有一定的参考价值。
前言
关联规则反映一个事物与其他事物之间的关联性,关联规则分析是从事事物数据库,关系数据库和其他信息存储中大量数据的项集之间发现有趣,频繁的格式,关联和相关性。更确切地说,关联规则通过量化的数字进行描述物品甲的出现对物品乙的出现有多大的影响。它的模式属于描述型模式,发现关联规则的算法是无监督算法。
以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟!
Apriori关联规则基本概念:
一.事务和项集
在关联规则所使用的数据中,把一个样本称为一个“事务”(transation);每个事务有多个属性来确定,这里的属性称为“项”(item),多个项组成的集合称为“项集”,根据项集中包含项的数量,项集可以是1-项集,2-项集或者k-项集,若k-项集满足认为设定的最小支持度,即称之为频繁k-项集。
二.支持度,置信度
以上是关于R语言应用实战系列-Apriori算法的相关内容(附案例源代码)的主要内容,如果未能解决你的问题,请参考以下文章
R语言apriori算法进行关联规则挖掘(限制规则的左侧或者右侧的内容进行具体规则挖掘)查看限制了规则的右侧之后挖掘到的规则(置信度排序,只查看左侧即可)
R语言apriori算法进行关联规则挖掘(限制规则的左侧或者右侧的内容进行具体规则挖掘)使用subset函数进一步筛选生成的规则去除左侧规则中的冗余信息获取更独特的有新意的关联规则