市场篮子分析 - 可变数量特征的单一模型?

Posted

技术标签:

【中文标题】市场篮子分析 - 可变数量特征的单一模型?【英文标题】:Market Basket Analysis - single model for variable number of features? 【发布时间】:2017-06-23 03:26:30 【问题描述】:

我正在使用 Apriori 构建一个推荐系统来配合我公司的应用程序。在走这条路之前,我想与有更多经验的人确认我走在正确的轨道上。任何帮助表示赞赏。

让我试着解释一下这个问题。根据应用程序中用户的上下文,影响推荐的功能可能会有所不同。例如,想象一个购物场景。如果我在 HEB 购物,我通常有一个预定义的购物清单,所以如果我只是告诉应用程序我要去 HEB,那么该清单上的物品将是很好的推荐。不过,当我去 Home Depot 时,我倾向于按部门购物,因此如果我告诉应用程序我在 Home Depot 并且我正在购买电动工具,那么电动工具和相关部件是很好的推荐。

您会看到,在这两种情况下,功能的数量会有所不同。第一,我的推荐完全取决于商店,而第二,它们取决于商店和我购物的部门。

我希望使用可以处理这种情况的单个 Apriori 模型。这会被认为是一种最佳实践,还是有不同的模型更好,一个用于我们只列出商店的时候,另一个用于我们列出商店和部门的时候?鉴于 Apriori 是一种无监督算法,我认为它可以用一个模型来完成,但由于我没有大量经验,所以想仔细检查一下。

【问题讨论】:

如果您在选型方面需要帮助,请联系Cross Validated,而不是这里。这似乎不是适合 Stack Overflow 的特定编程问题。 好的,我不知道这一点。感谢您的意见。 【参考方案1】:

在我看来,您在谈论多级关联规则。这是来自arulesaggregate 函数的手册页:

支持项目层次结构

说明:

通常项目层次结构可用于用于 关联规则挖掘。例如在超市数据集中 像“bread”和“beagle”这样的项目可能属于项目组 (类别)“烘焙食品”。

我猜更高级别的类别将是您的部门和商店。这将能够找到项目、部门和商店之间的关联。

【讨论】:

以上是关于市场篮子分析 - 可变数量特征的单一模型?的主要内容,如果未能解决你的问题,请参考以下文章

9主成分分析

机器学习之主成分分析(PCA&特征选择)

机器学习——09主成分分析

9.主成分分析

2021-03-23 特征选择的效果评估

7000 字精华总结,Pandas/Sklearn 进行机器学习之特征筛选,有效提升模型性能