数据分析10大经典模型

Posted 抱抱宝

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析10大经典模型相关的知识,希望对你有一定的参考价值。

1.帕累托分析

所谓的帕累托分析即“二八定律”,在任何一组东西中,最重要的只占其中一小部分,其余尽管是多数,却是次要的。例如公司要撤销一部分商品时,就可以优先选择撤销次要商品。

根据事物的主要特征,进行分类排队,把被分析的对象按照占比分成 A、B、C 三类(可根据实际需求按照不同的比例分成多类),从而分清重点和一般,有区别地确定管理方式。

上图通过组合图综合展现品牌销售额情况。按照0-80% A类,80%-90% B类,90%-100% C类进行划分,得出结论

A 类商品:ZIPPO、PAW IN PAW、NEW BALANCE、HANG TEN

B 类商品:SINOMAX、O.C.T.MAMI

C 类商品:WHO.A.U、RACB JJQN、LESPORTSAC、X.ZHINING

所以A类商品为主要商品,C类商品为次要商品,公司在做业务调整时,可优先撤销C类商品。

2.RFM客户分析模型

RFM模型是衡量客户价值和客户创利能力的重要工具和手段,其通过以下三个关键指标对客户进行观察和分类,针对不同的特征的客户进行相应的营销策略:

最近一次消费时间(R)

客户距离最近的一次采购时间的间隔,考察客户购买的沉默期。

最近一段时间内消费频次(F)

指客户在限定的期间内所购买的次数,考察客户的忠诚度。

最近一段时间内消费金额(M)

客户的消费能力,通常以客户单次的平均消费金额作为衡量指标。

此外还可计算客户消费能力与消费流失情况

由于M、F 为正向指标,则用M、F作为横纵轴代表客户消费的能力,值越大表示消费能力越高;R为负向指标,则代表消费流失情况,图形越大表示最近消费距今时间越长,流失越严重。

3.同环比分析

同比发展速度主要是为了消除季节变动的影响,用以说明本期发展水平与去年同期发展水平对比的相对发展速度。

环比表示连续2个统计周期(比如连续两月)内的量的变化比。

计算公式:

同比:(本期销售额-去年同期销售额)/去年同期销售额

环比:(本期销售额-上个周期销售额)/上个周期销售额

4.留存分析

留存分析是一种用来分析用户参与情况/活跃程度的分析模型,考查看进行初始行为后的用户中,经过一段时间后仍然存在客户行为(如登录、消费)的人数。留存不仅是个可以反映客户粘性的指标,更多地反映产品对用户的吸引力。

留存率:

当日留存率:当日激活并登录用户数/所有登录用户

一周留存率:初次激活日为维度,计算“激活-登录时间差”为 1-7 的登录用户数/所有登录用户数

两周留存率:初次激活日为维度,计算“激活-登录时间差”为8-14的登录用户数/所有登录用户数

三周留存率: ......

留存率中有一个重要的指标就是活跃用户UV,只有活跃才会产生用户粘性,用户才会留存。

5.转化分析

转化分析的本质是为了促进企业的核心业务的流通,最大化每个营销漏斗的转化率。

三个转化:

阶段转化对于需要进行逐级转化的平台运营,首先可以通过用户转化漏斗图进行宏观的流程转化数据分析找出目前阶段最需要优化的运营环节和平台,有效地进行针对性治理,最终提高整体平台用户转化率。

事件转化通常指的是平台或商铺通过一系列的运营推广活动以及由于公共事件影响所带来的额外价值,通常可关注于营销渠道转化率等指标进行活动的推广营销效果评估。

服务转化通常用户在网上购买商品时,良好的服务自然能够提高顾客的购买率,对于平台的客户人员,可以统计出其咨询到下单的节点转化情况,并且以咨询到下单的转换率指标作为KPI指标之一来评价客服人员的工作绩效。

6.杜邦分析

杜邦分析法利用几种主要的财务比率之间的关系来综合地分析企业的财务状况,用来评价公司盈利能力和股东权益回报水平,从财务角度评价企业绩效的一种经典方法。其基本思想是将企业净资产收益率逐级分解为多项财务比率乘积,这样有助于深入分析比较企业经营业绩。

净资产收益率受三类因素影响:

净利润率:销售净利润率衡量,表明企业的盈利能力。

销售净利润率=净利润/销售收入

总资产周转率:资产周转率衡量,表明企业的运营能力。

资产周转率=销售收入/总资产

财务杠杆:权益系数衡量,表明企业的资本结构。

权益系数=总资产/净资产=1/(1-资产负债率)

杜邦分析公式:净资产收益率(ROE)=销售净利率*资产周转率*权益乘数

7.商品关联分析法

通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,叫做商品关联分析法,也叫做“购物篮分析”。

支持度(support):是对关联规则重要性的衡量。

定义:支持度是指A商品和B商品同时被购买的概率,或者说某个商品组合的购买次数占总商品购买次数的比例。

支持度说明了这条规则在所有事务中有多大的代表性,显然支持度越大,关联规则越重要。

置信度(confidence):是对关联规则的准确度的衡量。

定义:置信度是指购买A之后又购买B的条件概率,简单说就是因为购买了A所以购买了B的概率。

提升度(lift):

定义:先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值,是看组合商品被购买的次数是否高于单独商品的购买次数,大于1说明该组合方式有效,小于1则说明无效。

8.需求分析

需求分析又称为KANO 模型法。

KANO 模型由满意系数和不满意系数来衡量:

Better:满意系数,代表如果产品提供某种功能或服务,用户满意度会提升。Better值越大/越接近1,则表示用户满意度提升的效果会越强。

Worse:不满意系数,Worse的数值通常为负,代表产品如果不提供某种功能或服务,用户的满意度会降低。其绝对值越接近1,则表示对用户不满意度的影响最大

根据需求类型可以又分为以下四种:

兴奋型需求: 属于惊喜型产品功能,超出用户预期,往往能带来较高的忠诚度。若不提供此需求,用户满意度不会降低;若提供此需求,用户满意度会有很大的提升。

期望型需求:当提供此需求,用户满意度会提升;当不提供此需求,用户满意度会降低。通常作为竞品之间比较的重点。

必备型需求:所谓痛点。对于用户而言,这些需求是必须满足的,理所当然的。

当不提供此需求,用户满意度会大幅降低。对于这类需求,是核心需求,也是产品必做功能。

无差异需求:用户根本不在意的需求,对用户体验毫无影响。这类需求可以不用做。

根据两个指标以及四种需求类型可以得到better-worse 四象限分布图

9.复购分析

复购分析用来说明用户的忠诚度,以复购率作为指标来衡量,复购率可以分为“用户复购率”和“订单复购率”。

用户复购率=单位时间内:购买两次及以上的用户数/有购买行为的总用户数

订单复购率=单位时间内:第二次及以上购买的订单个数/总订单数

此外,“用户回购率”意义与复购率相似,其计算公式为:

用户回购率=单位时间内:有购买行为的老用户数/有购买行为的总用户数

10.用户画像

用户画像即用户信息标签化,就是企业通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,完美地抽象出一个用户的商业全貌作是企业应用大数据技术的基本方式。

用户画像为企业提供了足够的信息基础,能够帮助企业快速找到精准用户群体以及用户需求等更为广泛的反馈信息。

例如xx公司ARPU(用户平均收入)9.57元,用户平均年龄38岁,在网时长108,249。

男性用户占比63%,20-30岁人数占比最大:19.33%,20-30岁用户收入占比最大,占总收入的30%


以上是关于数据分析10大经典模型的主要内容,如果未能解决你的问题,请参考以下文章

数据挖掘十大经典算法之EM

详解:7大经典回归模型

神经网络篇--基于数据集cifa10的经典模型实例

大数据经典算法解析(1)一C4.5算法

数据结构:10大经典排序

大数据经典算法解析(8)一KNN算法