商业数据分析案例:星巴克是如何优化促销活动的?

Posted 大数据v

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了商业数据分析案例:星巴克是如何优化促销活动的?相关的知识,希望对你有一定的参考价值。


导读:作为星巴克奖励系统的忠实粉丝(时不时给我免费早餐),我还挺好奇它到底是如何运行的。

比如,星巴克的数据科学家是如何通过选择不同的价格、产品、持续时间、内容等因素,组合出效果最好的促销活动。

今天我们就通过这篇分析,来尝试了解用户统计信息与促销活动之间的关系,并最大程度增加收入。

作者:Jae Beom Bae

翻译:之肴,编辑:肉松

来源:优达学城Udacity(ID:youdaxue)

01 目标

分析的目标是确定优惠信息和受众之间的重要关系。共有 10 个优惠,如下所示:

▲促销优惠

为了细分哪些受众与哪些促销有关,我们将对这10个优惠进行启发式分析和回归分析。

具体来说,我们要:

  1. 确定每个细分市场对哪些促销活动最为敏感

  2. 根据预期收入确定要发送给每个细分市场的促销信息

02 第 0 部分:预处理和探究

任何数据分析的第一步都是检查数据集的质量并进行预处理,以解决那些可能导致分析混乱的问题。

观察数据可以发现十分奇怪的一点,有一大批用户的年龄显示为“118”,这些用户也碰巧没有指明收入的值。我的猜测是,因为缺少相关的年龄和收入数据,所以只有在考虑性别对购买行为的影响时才用得上这些数据。

又因为我们只考虑年龄和收入,不包括性别,所以我将这些数据排除在分析之外。在仔细观察数据集的大小和分布之后,我认为最合适的细分方法是按年龄组和性别进行划分。尽管从技术上讲我们可以进一步细分(例如按收入、加入日期),但分到这一步就已经能很好地理解两者的关系。

除此之外,还可以执行一些其他的数据预处理方法,确保数据集便于分析,包括:

  • 将分类变量转为虚拟变量(dummy variable)

  • 统一日期格式

  • 从数据中提取特征

  • 进行特征工程以确定细分条件

03 第 1 部分:促销敏感程度

为了确定每个细分市场对 10 个优惠的敏感程度,我们需要观察优惠被查看后的购买情况,这其中不包括用户没看到优惠但依然购买的情况,也就是说他们总得花那么多钱。

▲不同人群的购买情况

综上所述,有几个关键点:

1. 一般情况

  • 在所有细分市场中,优惠5–8响应率很高,这些也都碰巧是通过社交渠道(以及网络、电子邮件、移动设备)提供的优惠。

    可以把社交渠道单拎出来验证它是不是会对反应率造成影响。

  • 优惠7的整体响应率特别高,而且它就是一个优惠的通知信息。

    但是和同类的优惠2相比,响应率存在明显差异——这进一步强调了社交渠道的有效性

  • 难度最高(10天之内最低消费为20美元)且奖励最高(5美元折扣)的优惠4的整体响应率最低,这很可能是由于只通过网络和移动设备发送的关系

2. 细分市场

  • 女性细分受众群(2、5、8、11)的平均响应率比男性细分受众群的更高,尤其是那些通过移动设备和社交渠道传播的优惠。

  • 细分1(千禧一代,男性)的响应率特别低(40%左右,而其他大多数都> 50%)。

  • 其他性别的细分(3、6、9、12)的响应率分布情况大为不同,这很可能与样本量极低有关。

总结来说,高响应率与通过社交渠道(尤其是女性群体)提供的优惠有关。

04 第 2 部分:哪种促销?

由于促销响应程度只是整个分析的一部分,因此我们需要更好地了解每个细分市场的财务情况所造成的影响。为了评估财务指标,需要进行回归分析。

从考虑的候选模型中,2阶多项式最为合适,因为它的训练和测试得分相对较高。

通过使用2阶多项式回归,我确定了每个细分受众群对优惠最多肯花多少钱:

最后我针对每个细分市场得出了热门优惠:

从这些结果中我们可以认识到:

  • 优惠4(5 美元折扣、10 天内花 20 美元)对大多数细分市场最为有效。

  • 一般来说,优惠 0、1 和 9效果也很好,紧随优惠4之后。

  • 前十种优惠的优惠类型不是“折扣”就是“买一送一”,几乎均等。

  • 收入与支出金额为正相关关系,与直觉相符。

  • “沉默的一代”细分市场预期收益最高,其次是“婴儿潮”和“千禧一代”。

    (“沉默的一代”:二十世纪二十年代中期至四十年代早期出生的人, “婴儿潮”:1946-1964年出生的人,“千禧一代”:八十年代早期至九十年代中期出生的人)

总的来说,高潜力的优惠(优惠4)可能由于其传播渠道和目标人群的选择而表现不佳。

05 结论

该分析提供了一些重要的看法,有助于缩小未来的分析范围和制定总体促销策略。

根据目前的优惠组合,最好的促销策略是向高收入女性(尤其是“千禧一代”和“沉默的一代”)提供优惠0和优惠1,因为她们的优惠购买率高,而且预期支出也相对较高。

但是,在制定强有力的促销策略之前,还得做一些其他实验和分析,其中包括:

  1. 验证购买率和传播渠道之间的关系。

  2. 具体来说,如果通过社交渠道提供优惠4(最高回报,最低购买率)会发生什么?

  3. 对于每个细分市场,要发送的优惠的最佳组合是什么?

  4. 探究“意外购买”(没查看优惠,但依然购买)的价值——它是否会导致未来的支出行为发生变化吗?

  5. 进行类别分析(例如K-Means聚类)来验证、确认识别出的细分市场。

  6. 有什么方法可以提高男性的购买率(因为他们的预期支出很高)?

  7. 用更大的样本数据对其他性别(3、6、9、12)进行细分。

原文:

https://towardsdatascience.com/starbucks-promotion-optimization-ca56e29fb584

延伸阅读👇

延伸阅读《利用Python进行数据分析》

干货直达👇

更多精彩👇

在公众号对话框输入以下关键词

查看更多优质内容!

读书 | 书单 | 干货 讲明白 | 神操作 | 手把手

大数据 | 云计算 | 数据库 | Python | 爬虫 | 可视化

AI | 人工智能 | 机器学习 | 深度学习 | NLP

5G | 中台 | 用户画像 数学 | 算法 数字孪生

据统计,99%的大咖都关注了这个公众号

👇

以上是关于商业数据分析案例:星巴克是如何优化促销活动的?的主要内容,如果未能解决你的问题,请参考以下文章

如何逆转增长颓势?星巴克数字化转型的成功实践

叫板星巴克的瑞幸咖啡,背后有什么数据分析套路?

星巴克其实是一家数据科技公司!?

星巴克分布式事务为什么不用两阶段提交?

Pandas数据处理+Matplotlib绘图案例

星巴克的饮料菜单是啥?