R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化

Posted 大数据部落

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化相关的知识,希望对你有一定的参考价值。

原文链接:http://tecdat.cn/?p=22732 

原文出处:拓端数据部落公众号

 

关联规则挖掘是一种无监督的学习方法,从交易数据中挖掘规则。它有助于找出数据集中的关系和一起出现的项目。在这篇文章中,我将解释如何在R中提取关联规则。
关联规则模型适用于交易数据。交易数据的一个例子可以是客户的购物历史。

数据分析的第一件事是了解目标数据结构和内容。出于学习的目的,我认为使用一个简单的数据集更好。一旦我们知道了这个模型,就可以很容易地把它应用于更复杂的数据集。

在这里,我们使用杂货店的交易数据。首先,我们创建一个数据框并将其转换为交易类型。

读取数据

  1.  
    n=500 # 交易数量
  2.  
     
  3.  
    trans <- data.frame() # 收集数据的数据框架

创建数据并将其收集到交易数据框中。

  1.  
    for(i in 1:n)
  2.  
    {
  3.  
    count <- sample(1:3, 1) # 从1到3的物品计数
  4.  
    如果(i %% 2 == 1)
  5.  
    {
  6.  
    if(!add_product %in% selected)
  7.  
    {
  8.  
    tran <- data.frame(items = add_product, tid = i)

检查交易数据框中的数据。

接下来,我们需要将生成的数据框转换为交易数据类型。 

  1.  
     
  2.  
    as(split([, "items"], [, "tid"]), "transa")

为了检查交易数据的内容,我们使用 inspect() 命令。 

挖掘规则

sort(rules_1, dby = "confidence")

.......

我们从上面的列表中获取第一个rhs项(规则后项)来检查该项的规则。但如果你知道目标项目,可以在参数中只写rhs="melon"。 

  1.  
    inspect(rules_1@rhs[1])
  2.  
     

> rhs_item <- gsub("\\\\}","", rhs)

我们为我们的rhs_item建立规则

按 "置信度 "排序并检查规则

  1.  
     
  2.  
    sort(rules_2, "confidence")

结果可视化

最后,我们从规则集_2中绘制出前5条规则。

> plot(rules_2[1:5])

绘制全部规则

交互可视化

绘制出前5条规则

  1.  
    precision = 3
  2.  
    igraphLayout = layout_nicely
  3.  
    list(nodes = nodes, edges = edges, nodesToDataframe = nodesToDataframe,
  4.  
    edgesToDataframe = edgesToDataframe,
  5.  
    x$legend <- legend
  6.  
    htmlwidgets::createWidget( x, width = width,
  7.  
    height = height)

绘制全部规则


最受欢迎的见解

1.采用spss-modeler的web复杂网络对所有腧穴进行分析

2.用R语言和python进行社交网络中的社区检测

3.R语言文本挖掘NASA数据网络分析,tf-idf和主题建模

4.在R语言中使用航空公司复杂网络对疫情进行建模

5.python隶属关系图模型 基于模型的网络中密集重叠社区检测

6.使用Python和SAS Viya分析社交网络

7.关联网络分析:已迁离北京外来人口的数据画像

8.情感语义网络游记数据感知旅游目的地形象

9.用关联规则数据挖掘探索药物配伍中的规律

以上是关于R语言关联规则模型(Apriori算法)挖掘杂货店的交易数据与交互可视化的主要内容,如果未能解决你的问题,请参考以下文章

R语言使用apriori算法进行关联规则挖掘实战:关联规则概念频繁项集支持度(support)置信度(confidence)提升度(lift)apriori算法

R语言apriori算法进行关联规则挖掘(限制规则的左侧或者右侧的内容进行具体规则挖掘)查看限制了规则的右侧之后挖掘到的规则(置信度排序,只查看左侧即可)

R语言Apriori算法关联规则挖掘:使用interestMeasure函数评估挖掘到的规则(包括覆盖率(coverage)和FishersExactTest)置信度最高的五条规则(top five

多维关联规则挖掘算法r语言能实现吗

R语言apriori算法进行关联规则挖掘(限制规则的左侧或者右侧的内容进行具体规则挖掘)使用subset函数进一步筛选生成的规则去除左侧规则中的冗余信息获取更独特的有新意的关联规则

R语言Apriori算法关联规则对中药用药复方配伍规律药方挖掘可视化