基于网站的用户行为分析
Posted jingxianli0922
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于网站的用户行为分析相关的知识,希望对你有一定的参考价值。
谁在使用我的网站——用户行为分析
前面根据用户的特征对用户做了分类,设定了一些常用的用户指标和值得关注的用户指标,基于这些分类用户指标的分析可以发现用户运营和推广中的诸多问题,其中活跃用户和流失用户的定义中已经用到了与用户行为相关的指标,这里重点介绍常用的用户行为分析指标以及基于用户行为的分析。
如们以网站的用户为主体去理解点击流数据,其实它记录的就是用户在网站中的所有行为数据。培训专家余世维在讲座中常说:行为决定习惯,习惯决定性格,性格决定命运。古语也有类似的话:积行成习,积习成性,积性成命。虽然不能说从用户在网站的行为就能判断用户的性格甚至命运,但如果要从用户在网站的行为中判断用户对网站的期望和喜好还是可以的,关键在于如何处理和分析这些行为数据。
每个用户行为指标的分析价值
点击流数据记录了用户在网站的几乎所有行为动作,衍生出许多行为指标,有些指标是所有网站都统一的,比如访问频率、平均停留时长等;有些指标根据网站的特征定制,比如电子商务网站的消费行为、社区网站的内容发布行为和社交媒介的信息互动行为。我习惯将用户的行为指标分为三大类,即黏性、活跃和产出,每个分类可以包含多个行为指标来共同衡量用户在这三类中的行为表现,进而区分用户的行为特征,对用户进行分类或者综合评定,如图6-7所示。
图 6-1 用户行为分析分类指标[z1]
用户行为指标中的黏性(Stickiness)主要关注用户在一段时间内持续访问和使用网站的情况,更强调一种持续的状态,这里将“访问频率”和“访问间隔时间”两个指标归到了黏性的分类;活跃(Activity)则更多地针对用户每次的访问过程,考察用户访问中的参与度(Engagement),所以对统计期中用户的每次访问取了平均值,选择“平均访问时长”和“平均访问页面数”来衡量活跃;黏性和活跃从用户的访问情况衡量用户可能创造的价值,可能是显性也可能是隐形,如品牌、口碑等,但产出(Outcomes)直接根据网站的业务衡量用户创造的直接价值输出,如电子商务网站可以选择“订单数”和“客单价”,一个衡量产出的频率,另一个衡量平均产出价值的大小。
用户行为分析注意点!
在统计用户行为指标进行分析时,需要注意选择合适的时间段,时间段的长度不能过短,不然无法体现用户长期和持续性的行为特征,黏性指标的分析会不准确;同时短期的用户行为也会误导对用户整体特征和价值的判断,有可能用户在该段时间内极度活跃或者极度低调,也可能用户在短时间内创造了高产出,但从长期看用户创造的价值并没有那么高。
用户行为指标统计的时间段可以根据网站业务特点和用户的行为密度进行选择,对于一般的网站,建议每月统计一次比较合适,可以针对某些用户或分类来比较每月的行为指标数据的变化。
根据需要,可以创造其他的用户行为分类,也可以基于这三类,每个类别添加不同的行为指标,前提是每个行为分类能够体现其分析的价值,并且每个分类下的指标可以有效地衡量这个分类的绩效表现,尽量保证分类和指标分析上的独立性,不存在作用的重叠。比如,在黏性使用了访问频率,访问次数越多相应的总的访问页面数(Pageviews)也越多,如果在活跃中选择总的Pageviews,指标间就存在相互的关联性,进而对分析结果产生重复的影响,所以这里选择每个访问的平均访问页面数来保证指标的独立性。基于行为分类和指标的独立性,就能体现出不同的分析价值。
用户行为分析还有一种更简单的方法——RFM分析,仅选择三个指标:
w 最近一次消费(Recency)
w 消费频率(Frequency)
w 消费金额(Monetary)
RFM分析原先用于传统营销、零售业等领域,适用于拥有多种消费品或快速消费品的行业,只要任何有数据记录的消费都可以用于分析。在网站分析中电子商务网站可以直接套用,其他网站也可以基于RFM的分析思路进行修改后使用。
提取相关数据之前,首先需要确定数据的时间跨度,根据网站销售物品的差异,确定合适的时间跨度。如果经营的是快速消费品,可以确定时间跨度为一个季度或者一个月;如果销售的产品更替的时间相对久些,如电子产品,可以确定时间跨度为一年、半年或者一个季度。因为RFM也是基于用户持续行为的分析,所以不建议获取短时间内的数据。
其中最近一次消费(Recency)取出来的数据是一个时间点,需要计算与当前时间的间隔,单位可以是天,也可以是小时;消费频率(Frequency)这个指标可以直接对每位用户的消费次数进行计数得到;消费金额(Monetary)这里取的是该时间段内每位用户的消费总额,通过相加(SUM)求得。获取三个指标的数据以后,需要计算每个指标数据的均值,分别以AVG(R)、AVG(F)、AVG(M)来表示,最后通过将每位客户的三个指标与均值进行比较,可以将客户细分为8类,见表6-1。
表 6-1 RFM分析用户分类
访问间隔 | 访问频率 | 消费金额 | 客户类型 |
é | é | é | 重要价值客户 |
é | ê | é | 重要发展客户 |
ê | é | é | 重要保持客户 |
ê | ê | é | 重要挽留客户 |
é | é | ê | 一般价值客户 |
é | ê | ê | 一般发展客户 |
ê | é | ê | 一般保持客户 |
ê | ê | ê | 一般挽留客户 |
注:“é”表示大于均值,“ê”表示小于均值
表6-1中,我们可以认为当消费金额大于均值时该用户能够创造较高价值,因此是网站的重要用户;访问频率高于均值,用户访问比较持续,应该保持这种持续性,而访问频率过低的用户需要提升他们的访问频率,属于需要发展的用户;最近访问间隔从某种程度上反映用户流失的倾向,间隔时间越长用户流失的可能性越大,对于这类用户需要重点挽留。
RFM模型包括三个指标,无法用平面坐标图来展示,所以这里使用三维坐标系进行展示,其中X轴表示Recency,Y轴表示Frequency,Z轴表示Monetary,坐标系的8个象限分别表示8类用户,根据上表中的分类,可以如图6-8所示进行描述。
图 6-2 RFM分析用户分类三维图
原始的RFM分析只能分析有交易行为的用户,而对访问过网站但未消费的用户由于指标的限制无法进行分析,这样就无法发现潜在客户。所以在分析电子商务网站的用户时,由于网站数据的丰富性,不仅拥有交易数据,而且可以收集到用户的浏览访问数据,可以扩展到更广阔的角度去观察用户。
基于用户行为指标的用户分布
基于上面用户行为指标的统计结果,可以结合一些图表来表现每个行为的用户分布情况。Google Analytics上面在用户行为模块中对新老用户占比、访问频率和间隔、访问时长和深度的分布情况进行分析和展现,如访问频率的用户分布情况,使用了条形图进行展现,如图6-9所示。
图 6-3 Google Analytics用户访问频率分布图
图6-9展现了访问次数在1~5次的用户的访问数和页面浏览数,及访问数和页面浏览数在总体中所占的比例。用于展现数据分布情况的图表有很多,比如用饼图可以显示每个数据类别的比例,可以用于新老用户占比的展现,最常用是直方图,直方图与柱状图比较类似,而柱状图常用来展现不同数据项的数量大小,如每个省份的访问数,这里的横坐标省份间是相互独立的,所以每个柱形之间是相互分离的,而直方图则常用于展现频数和分布,横坐标的数据一般是连续的,所以直方是紧靠在一起的,很多时候横坐标是基于分组的数据,我们将用户的客单价分组后展现每组数据的用户分布比例,如图6-10所示。
图 6-4 客单价用户分布图
图6-10中,将客单价每隔30进行分组(图中30显示的是客单价为0~30的用户比例,以此类推),大于300的独立一组,统计每组用户数及所占比例并展示。数据的分组尽量使用一样的组距,这样可以让数据看上去更均匀,但有时候由于数据分布比较特殊,使用不相同的组距也未尝不可,但要注释清楚。直方图的分组个数在6~20比较合适,如果横坐标的分组或数据项异常多,可能展现出来的直方图看上去会非常密集,这时可以借助“趋势线”来观察数据的整体分布情况,或者使用带平滑线的散点图,如图6-11所示。
图 6-5 访问间隔天数用户分布图
图6-11所示的是近60天中访问的用户的最近一次访问距离当前的间隔天数的用户分布图,显示了每个访问间隔天数的用户比例,因为没有对数据做分组,横坐标显示了连续的60天的数据,所以使用了带平滑曲线的散点图进行展现,能够比较直观地展现用户的保留情况。我们可以从图中得到一些其他信息,比如可以定义访问间隔天数超过两周的为沉默用户或者休眠用户,只要取访问间隔天数超过14天的用户就可以得到相应的用户比例;如果定义访问间隔超过30天的用户为流失用户,也可以从图表中计算得到流失的用户比例。所以基于用户的行为分布图可以获取一些额外的用户统计指标。
直方图或者带平滑曲线的散点图都只能表现用户分布的频数或比例中的一个指标,借助排列图可以将频数和比例同时展现在一张图中,如图6-12所示。
图 6-6 消费次数用户分布排列图
图6-12的排列图也叫帕累托图,原先主要用于产品质量管理的领域,用于统计和分析引起产品质量问题的主要因素,使用直方图表示数据分布的频数,使用折线图表示数据分布的频率的累计。从这个消费次数的用户分布图中可以得到很多信息:零消费(消费次数为0次)用户比例与消费(消费次数大于0次)用户比例、单次消费(消费次数为1次)用户比例和多次消费(消费次数大于1次)用户比例,所以基于用户分布图同样可以做用户的行为细分。
散点图较多地用于表现两个指标之间的联系,在相关分析和回归分析中较常用,但其本质也是展现数据的分布,而且是基于两个指标展现数据点的分布位置,这里选择用户访问的平均停留时长和平均浏览页面数来绘制散点图,如图6-13所示。
图 6-7 平均访问时长&页面数用户分布图
图6-13中,我们抽取了100个用户作为样本展现每位用户平均每次访问的停留时长和浏览页面数的分布情况,从图中可以发现网站中有多少用户比较活跃,例如定义平均停留时长超过3分钟(180秒)并且平均页面浏览数超过3个的用户为活跃用户,那么图中绿框范围内的用户就是活跃用户,并且越接近绿框的右上角,用户的活跃度越高。
用户行为指标的用户分布可以帮助我们发现许多额外的信息,同时基于每期的统计结果进行比较并分析用户各行为指标分布的变化可以掌控用户的发展情况,所以定期统计和分析用户行为指标的分布情况是十分有用的。
基于用户细分的用户行为分析
前面对用户的分类和行为做了分析,但对于分析的输出结果,我们可能无从下手,观察新老用户、流失用户及用户的各种行为指标和行为分布也许可以做出很好的报告,评估用户的发展情况,但结论太过宏观,我们所能做的也只是根据分析结果调整用户的整体运营策略,其他能够采取的细节措施寥寥无几。而网站分析始终需要把握的一个前提就是分析的结果需要有效地指导行动(Take actions),所以这里就要介绍如何得到更加有效的见解(Insights)。
前面已经介绍过一些常见的用户分类:新老用户、流失留存用户等,不同的用户分类群体可能会有不同的行为表现,我们可以通过分析各种用户分类的用户行为指标来区分各类用户的特征及对网站的期望要求,进而针对各类用户群体进行调整和定向的营销推广。这里主要以指导内容层面的调整为导向,通过比较各用户细分群体对内容需求的差异,优化内容运营,将优质的内容或者符合用户偏好的内容推荐给相应的用户。这里举例三类用户细分,即流失用户与留存用户、新用户与老用户、单次购买用户和二次购买用户,基于这三类细分,对每个分类的用户购买商品进行比较分析,明确哪些商品更加符合用户的预期。
这里的细分比较还是以电子商务网站的数据为例,首先是基于流失用户和留存用户,电商网站的内容就是商品,我们基于每个商品计算购买这些商品的用户中购买之后造成流失的用户比例,如图6-14所示。
图 6-8 流失用户和留存用户细分比较
首先要明确一下图中各指标的定义,每个商品的流失用户比例应该是购买该商品后流失的用户数在所有购买该商品的用户中的占比,但只知道每个商品的流失用户比例无法评价这个商品是否对用户保留有促进作用,或者在一定程度上造成了用户的流失,只有通过与总体水平的比较才能得出相应的结论。所以这里需要重点解释的是“与总体比较”这个数值是怎么计算得到的,这里的百分比不是直接相减的结果,而是一个差异的幅度体现,这里假设总体用户流失率为56%,那么以A商品为例,与总体比较的结果是:( 58.13% - 56% ) / 56% = 3.80%,使用同样的计算方法也可以得到其他商品与总体比较的差异幅度。最后就是展示,在Excel中通过“条件格式”里面的数据条功能可以直接展现出图中的效果,非常方便。
图6-14中截取的Excel数据条的展示效果基于Excel2010,Excel2010开始支持双向的数据条,以零为界,正数向右负数向左,2010之前的版本仅支持单向的数据条。数据条左右方向的颜色都可以自定义,默认负数为红色、正数为绿色,基本思路是红色表示指标表现较差,绿色表示指标表现较好,这里因为与总体比较流失率较高(正数)表现为不好,比总体低(负数)表现较好,所以对数据条的左右颜色进行了互换,正数为红色,表现较差,负数为绿色,表现较好,之后的图表也遵从这个原则。
很明显,图6-14中的分析结果对运营调整有直接的指导性,目的是促进用户保留,所以我们要做的就是将有利于用户留存的商品(F商品的用户流失率明显要比总体低得多,说明F产品更有利于用户保留)推荐给用户,而将那些可能导致用户流失的商品(C商品)进行优化或者下架。
同样,使用上面的方法可以区分不同用户群的购买偏向。新老用户的细分是最常见的用户细分方法,我们可以使用类似的方法来看看新老用户对商品的不同喜好,如图6-15所示。
图 6-9 新老用户细分比较
从图6-15中你看出了什么?购买D商品的用户中新用户的比例明显偏低,也许新用户根本就不喜欢这个商品,而B商品和F商品显然更加符合新用户的口味。如果你的网站可以进行新老用户区分的定向推广,那么上面这个分析结果将让你受益良多。
当然,这个数据呈现的特征可能跟商品的推广渠道有一定关系,比如图6-15中的D商品可能使用老用户比较集中的推广渠道(如EDM),那么购买用户中自然老用户的比例会偏高;或者把某些商品放在新用户比较集中的Landing Page中展示,那么购买该商品的新用户比例显然也会偏高。所以,在做此类分析时需要注意根据推广渠道的差异,具体问题具体分析,不能一概而论。
再来看一下类似的方法怎么促成用户的重复购买。对于电子商务网站而言,用户的首次购物体验非常重要,这会直接影响用户是否会产生再次或者之后的多次购买,或者是否能够成为网站的忠诚客户。如果你的网站注重用户关系管理,有足够的数据支持,那么可以尝试下使用如图6-16所示的分析方法。
图 6-10 首次二次购买用户细分比较
需要注意的是,这里的基础用户群设定在了每个商品的首次购买用户(不是所有用户),我们要分析的是所有将该商品作为首次购买商品的情况下,用户是否还会发起之后的再次甚至多次购买行为(这里的二次购买用户不是指购买次数是2次的用户,而是指所有购买次数超过1次的用户),从而评价商品对于首次购买体验的影响好坏。从图6-16可以看出,B商品和F商品在促成二次购买的表现不佳,很有可能商品的使用或质量问题影响了用户的满意度,阻碍了用户再次购买的脚步。根据分析结果,我们尤其需要对那些二次购买率比总体水平低很多的商品进行重点关注,同时也需要根据商品的特征进行分析,有些商品确实比较容易促成二次购买,因为可能存在交叉销售和向上营销的情况。
如果你从Google Analytics上寻找类似的数据,其实唯一可以找到的就只有新访问比例,因为GA没法细分首次购买和二次购买用户,而流失和留存用户是网站的自定义指标。在GA的内容模块里面细分到每个页面的指标也未包含% New Visits(在流量来源、地域细分里面有该度量),所以需要自定义报告来查看网站每个页面的新访问比例,比较的基准还是网站总体的新访问比例,GA的展现方式选择里面直接提供了与总体比较的视图“Comparison”,图6-17是我做的自定义报表。
图 6-11 GA基于内容细分新老用户比较
如图6-17所示,GA上面展现的效果和用Excel 2010定制条件格式后的效果很像,这种基于基准的比较展现非常直观实用,其实在其他分析中同样可以用到。我的博客文章的新用户比例比较中可以分析出什么?访问数排在前几名的文章中很明显的趋势就是概念性和方法论的文章的新用户比例高于均值(当然主要靠搜索引擎的帮忙),而观点性和分析性的文章的新用户比例低于均值(老用户更偏向于实践和应用),所以如果我的博客可以动态向新用户和老用户展现不同的内容,那么这个分析将十分有价值,也许你的网站可以尝试一下。
最后用一句话总结:细分是用于比较的,比较是为了反映差异进而做出调整优化的,所以细分的目的最终还是指导运营决策,这才是数据分析的价值体现。
以上是关于基于网站的用户行为分析的主要内容,如果未能解决你的问题,请参考以下文章