使用学生数据集进行关联规则挖掘

Posted

技术标签:

【中文标题】使用学生数据集进行关联规则挖掘【英文标题】:Association Rule mining using a student dataset 【发布时间】:2019-12-30 16:00:03 【问题描述】:

我有一个这样的数据集:

Id|Sem|Grade|Rating|SUB
1|2|A|3|sub1
1|4|C|1|sub2
2|2|B|2|sub1

我想对以上数据形成关联规则,并推荐sub1,sub2给学生。我该怎么做? 我试过了:

records=[]
for i in range(0,60):
    records.append([str(df.values[i,j]) for j in range(0,5)])
from apyori import apriori
assosciation_rules=apriori(records,min_support=0.1)
assosciation_results=list(assosciation_rules)

输出看不懂。有没有更好的办法。输出是这样的:

[RelationRecord(items=frozenset('0'), support=0.3333333333333333, ordered_statistics=[OrderedStatistic(items_base=frozenset(), items_add=frozenset('0'), confidence=0.3333333333333333, lift=1.0)]),....

【问题讨论】:

【参考方案1】:

试试

for i in range(0,60):
    records.append([df.columns[j]+'='+str(df.values[i,j]) for j in range(0,5)])

这将 a) 提高可读性 b) 消除代码将所有零视为相同的错误(无论它们来自哪一列)

【讨论】:

【参考方案2】:

读取结果的一种更好的方法是将记录的内容放入列表中。这个问题的答案中提供了这样做的方法:“RelationRecord object of apyori module” apriori algorithm python

【讨论】:

这只是我的问题的一部分。你能看看另一个吗?

以上是关于使用学生数据集进行关联规则挖掘的主要内容,如果未能解决你的问题,请参考以下文章

使用Apriori进行关联分析

使用频繁项集挖掘构建关联规则?

程序员之家 | 数据挖掘算法揭秘篇——关联规则方法

增量关联规则挖掘—FUP算法

关于数据挖掘中的apriori算法,帮忙推出关联规则 事务数为 5 支持度为0.6,置信度为0.6

关联规则