数据分析一定要懂的模型——购物篮模型

Posted Leo.yuan

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析一定要懂的模型——购物篮模型相关的知识,希望对你有一定的参考价值。

要想做好数据分析必定要理解和熟悉掌握各类数据分析模型,但网络上的大部分文章只是给你罗列出了有哪几种数据分析模型及对应理论,并未用实例来辅助说明。

很多时候,看完就只是看完,并没有深刻理解这种分析模型,等到下次要开始分析数据了,又是一脸懵,然后再去收藏夹里翻文章。

学东西在精不在多,老李今天就分享1个常用的数据分析模型——购物篮分析模型,并附上应用实例,希望能让大家真正掌握这个分析模型,并在之后分析数据时能自己把模型灵活用起来!

购物篮分析模型原理

不知道大家去逛超市时有没有发现,超市里常会把婴儿的纸尿裤和啤酒放在一起售卖。其实原因也很简单,超市经过数据分析发现,买尿不湿的家长以父亲居多,如果他们在买尿不湿的同时恰好看到了啤酒,就会有很大的概率购买,从而就能提高啤酒的销售量。

看到这,你可能会觉得这不是常识吗?为什么还是个数据分析模型。

其实不然。虽然这种现象你看过去是常识,但这种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,就叫做商品关联分析法,即购物篮分析模型。需要通过「支持度」、「置信度」、「提升度」三个指标判断商品之间的关联程度,常用于零售行业。

这个模型一般是用来找出顾客购买行为的模式:
①比如用户买了A商品,是否会对B商品产生什么影响?
②不同的用户是否具有不同的购买模式?
③哪些产品应该放在一起进行捆绑销售?
在分析案例前,先解释下这三个指标分别代表的意思和计算方法。

「支持度」:A商品和B商品同时被购买的概率,显然支持度越大,商品间关联性越强。

计算公式:同时购买A和B订单数 / 总购买订单数

今天共有10笔订单,其中同时购买可乐和薯片的次数是7次,那么可乐+薯片组合的支持度就是7/10=70%。
「置信度」:因为购买了A所以购买了B的概率,注意与支持度区分。

计算公式:同时购买A和B订单数 / 购买A的订单数

今天共有10笔订单,其中购买可乐的次数是4,同时购买可乐和薯片的次数是3,则其置信度是3/4=75%
「提升度」:先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值,大于1说明该组合方式有效,小于1则说明无效。

计算公式:支持度 / ( (购买A次数/总购买订单数)*(购买B次数/总购买订单数) )

今天共有10笔订单,购买可乐的次数是8,购买薯片的次数是6,购买可乐+薯片的次数是6,那么提升度是0.6 /(0.8*0.6)>1,因此可乐+薯片的组合方式是有效的。
讲完购物篮模型的原理和计算公式,只能大概掌握一些皮毛,接下来老李就带你用实例来应用一下购物篮分析模型,加深印象。

案例分析

以我们最为熟悉的超市为例。案例背景是A集团超市最近在准备周年大促,需要根据近3个月A集团超市旗下各门店商品销售明细,来确定哪些商品需要组合起来捆绑促销。

先不急着分析,先理清一下思路,要解决这个问题,我们需要从以下五个步骤进行思考。

第一步:确定使用工具、数据来源

使用工具:FineBI数据分析工具

数据来源:A集团超市商品销售总表(已脱敏处理)


A超市商品销售总表

第二步:计算指标

根据上述计算公式可知,我们需要计算

①总购买订单数 ②同时购买A和B的订单数 ③分别购买A和B的订单数

接下来,我们就利用FineBI工具来逐个计算。

①总购买订单数

要计算总购买订单数,首先我们要先勾选「单据编码」,添加分组汇总,设置汇总方式为「去重计数」,对单据编码个数求和,从而轻松计算出总购买订单数。

②计算同时购买A和B订单数

要计算同时购买A和B的订单数,就需要复制一列相同的商品类别,将两列合并在一起,就可以分出比如A+A、A+B、B+A等的商品组合。

让表左右合并,而后选择并集合并,合并依据为单据编码。

将商品名称作为A商品,集团商品总表-商品名称作为B商品。显然,不需要类似 A+A 的组合,因此需要将该数据过滤掉,输入函数【商品名称!=集团商品销售总表-商品名称】即可。

③计算分别购买A和B的订单数

添加左右合并,并将合并结果命名为「购买A的次数」,B商品同理计算。

第三步:计算支持度、置信度、提升度

得到上面三个指标后,我们就可以开始计算支持度、置信度、提升度了。

支持度=同时购买A和B订单数/总购买订单数,新增列。置信度,提升度同理,就不列举了。

第四步:数据分析

计算得到支持度、置信度、提升度的结果后,我们就可以开始进行数据分析了。

使用FineBI的自定义图表,分析商品间的关联程度,用颜色的深浅和具体计算数字来表示关联程度的高低。


商品关联分析


商品支持度分析


商品置信度分析


商品提升度分析

第五步:得出分析结论

(1)微爽日用卫生巾和家之寓圆形夹晒架的支持度(同时购买概率)最高,为5.95。且购买家之寓圆形夹晒架后又购买微爽日用卫生巾的置信度较高,为0.27,大于平均置信度,因此两者被一起购买的概率很大,可放置在货架的相邻位置,刺激顾客购买欲。

(2)本地小白菜和香妃蜜瓜的置信度最高,为0.42。因此可将小白菜和香妃蜜瓜放在果蔬货架的相邻位置或捆绑销售。

(3)青葱和雪碧的提升度最高,为8.44。即购买雪碧后对购买青葱有较大的提升作用,但考虑到青葱和雪碧的购买量都较大,且都为常备品,基于实际情况来说,不适合捆绑销售。

(4)盐津铺子和嘉士利威化饼的提升度较高,为4.54,大于1。两个都为零食货柜商品,因此可考虑捆绑销售。

总结

经过上述五个步骤,我们可以得出初步的分析结论。当然,最后的零售促销方案还是得根据超市的实际情况来判断合不合适(例如分析结论中的青葱和雪碧),数据只能辅助我们的决策,而不能直接给予决策。

最后,分享一下数据分析工具和数据源,大家可以操作试试,毕竟实践出真知

回个“购物篮模型”就能获得!

以上是关于数据分析一定要懂的模型——购物篮模型的主要内容,如果未能解决你的问题,请参考以下文章

财务数据人一定要懂的分析方法——杜邦分析法

产品要懂的技术:TCP/UDP协议到底是怎么回事

Android Tangram模型:连淘宝天猫都在用的UI框架模型你一定要懂

测试开发要懂的设计模式知识

web安全day16:人人都要懂的OSI和TCP/IP协议簇

作为 Gopher 你一定要懂的连接池