数据分析避坑指南-小白兔踩坑记
Posted 云 祁
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析避坑指南-小白兔踩坑记相关的知识,希望对你有一定的参考价值。
从一开始的数据分析“小白兔”,不断进坑、弹跳出坑,练就健壮有力的小腿,逐步变成一只拥有了防御能力、没有那么弱小的“小灰兔”。
成长和职业发展的过程,就是进阶打怪的过程。进阶初始,由于经验不足,还是一只“小白兔”状态,容易相信,缺少判断,总是会遇到各种各样“坑”,并且跳进各种各样的“坑”;随着跳进爬出一些坑,兔腿逐渐健壮有力,经验逐渐丰富,能够逐渐警惕到前方有坑,然后绕路避行,逐步会变成一只反应敏捷有了防御能力的“小灰(ye)兔”。
很久很久以前(也并没有很久),在我还是一只弱小的数据分析“小白兔”时(现在是没那么弱小的“小灰兔”),也跳进了很多坑。记录作为数据分析“小白兔”遇到的三个坑,并且提出防坑避坑指南,希望告诫自己,也与未来要上路的小白兔共勉,努力不在同一个坑里跳进两次。
1
需求缠身坑
入坑的状态表现为,待办列表中全是业务提出的未完需求,大多数是取数和报表,每天上班做着不是特别喜欢的事情,分身乏术,下班感觉身体被掏空,但是心灵又没有得到满足。
当有这样的感受时,就需要警惕,你可能进了需求缠身坑。长期不出坑,会消磨对工作的热爱和初心,而且难以成长。取数和做表的事情,机器可以完成,那你和机器的价值又在哪里?那如何避坑呢?
1.1 事前规划,方向一致
一方面做着业务需求,一方面身在曹营心在汉,想要做自己规划的“大事”,效率会很低,而且工作积极性会消耗。做一件业务不认可的事情,数据是很难落地的,而没有落地的数据,可能只是自嗨,不会产生真正的业务价值。那为什么不在事前就统一规划,双方达成一致呢?双方认可的事情,未来的工作方向才有可能聚焦重点,也有了打回业务需求的“靠山”。
为了实现这样规划的目的,为了聚焦双方自愿的重点,是需要做一些准备的。
规划的产出要明确
在开始之前,需要明确规划想要达到的目标和最终产出是什么。不是一份需求排期文档,是对于整年发展的共识,是自顶而下的设计,是可指导未来整年的方向节奏的。
发展方向认可且一致。明年的发力方向有哪些,比如库存管理依然是发展方向,这是继续探讨的基础。
明确基于方向的重要事项。比如库存管理拆解下来有健康商品管理和不健康商品管理,这是可以继续落地拆解的。
重要事项的子项目拆解。比如健康商品管理应该有哪些子项目组成,除了明确子项目有哪些,还需要明确子项目组的成员和牵头人,以及子项目的目标和执行节奏。只有子项目具体到牵头人,才会有后期持续推进落地的可能。
制造一个规划的场合
想清楚了规划的产出是什么,就需要制造一个规划的场合,场合的重要要素是参与人,是否需要双方领导参与,需要到什么粒度的同学参与,都需要考虑在内。
制定规划的策略
为了产出这个规划结果,需要考虑应该是怎样的会议流程和会前准备。比如双方肯定会有不同的出发点,为了达成重要事项和子项目的一致,可能需要一个开放的讨论。会议的时长、节奏安排,都要基于会议流程合理安排。
1.2 结果导向,向需求say no
基于整体的规划,在面对业务需求时,可以从结果导向出发,以终为始,考虑几个点:
业务需求痛点是什么?为什么需要?会怎么使用?
是否影响到严选发展?影响金额有多少?影响程度有多大?
是否影响到核心项目的核心指标?影响程度有多大?
和个人发展有没有契合度?
基于业务需求的理解,后面三项问题的重要度和优先级逐渐递减,如果所有的问题都是YES,那毫无疑问,是可以接下;但如果所有的问题答案都是NO,那也毫无疑问,勇敢say no。
1.3 保障重点,分配资源
如果判断了业务需求也是符合发展方向和项目结果的,还需要聚焦和关注主要矛盾。因为可做的事情很多,能够辅助业务结果优化的事项也很多,需要找到对结果影响最大的点,再做资源投入的判断,可以掌握主动性。
做到上面这些点,还需要时刻提醒自己跳出来,保持清醒,陷入做数据是一件很容易迷失的事情。每天晚上想想,自己今天做到了没。
2
数据设计坑
作为一个数据分析师,不管是从分析角度还是从复盘监控的角度出发,都不可避免做报表的工作。报表的开发,从指标设计、代码开发、报表设计,每个环节,都隐藏着坑,一不小心,就踩中了。踩中出坑的成本是比较高的,轻则“优化”,中度“重构”,重则“做了白做”。因此这个坑能避则避,保持慎重和敬畏。
2.1 遵循【指标设计】规范
数据指标的设计能力,是数据分析师的基础能力。科学的指标可以直接反映业务问题,不科学的指标会让某些场景成为漏网之鱼。
谁来提出?谁来设计?
业务可以是指标提出者,比如业务提出监控指标是订单量,但是数据分析师需要是指标的设计者。衡量量级用量,衡量程度用率,大家可能都知道,但这只是一个方向,各有所长,业务提出的指标需要遵循规范。之前经历过比较痛的改革,比如退款率的优化、上架准时率的试图改良口径,是业务提出后,没有经过数据同学按指标设计规范进行判断的产物,优化和变革成本是很高的。
指标设计的出发点
指标设计是基于业务背景出发的,明确想要衡量的是什么业务操作,需要反映业务真实情况。
需要判断指标类型。基于这个指标想要反映的业务场景,需要的业务结果指标,还是过程指标,如果是结果指标,能否拆解到可落地的过程指标。
指标口径规范化
基于业务背景,去设计指标口径,首先需要明确的是,分子分母时间口径需要对齐,这样分子分母的因果关系才是可比较的。
其次,需要去考虑,如果出现指标波动,能否定位业务问题?怎么定位业务问题?如果整个指标设计,是说得通的,且业务是这样执行的,那说明指标口径和设计是有效的。
2.2 【代码开发】简洁可维护
数据分析的重点在分析,而非开发,因此在需要进行数据开发时,尽量一次做好,后期工作中尽量减少会出现二次开发和维护的时间成本。
节点依赖关系轻量
需要在开发之前,把节点的内容和依赖关系明确,如果开发之初没有想好,且不断叠加,可能会像一张蜘蛛网,这种任务的维护成本和交接成本很高。
尽量写分区任务
分区任务在每天执行时,执行速度更快,资源使用更加轻量。特别是需要进行数据回刷时,分区任务的执行速度表现就更加优秀了。
2.3 【报表设计】,简就是繁
报表设计环节,尽量用最少的指标反映最多的事情。报表设计100个指标和10个指标,可能10个指标的报表是更好的,真正的业务运作过程中,谁会每天去看100个指标来指导做事呢?
报表是只有日常看,还是特殊时期看。
需要明确业务看指标的起因是什么,动机是什么。决定了报表要把哪些重点指标明确call out。
需要明确业务看完指标以后,落地的业务动作是什么。如果看完指标,看了就看了,没有相应的业务措施去解决落地,那是无法产生业务价值的。
3
有始无终坑
什么叫有始无终呢?拿不到结果的都是有始无终。每一次决定付出时间的事情,都需要跟进到底。如果付出了时间,却没有跟进到底,那可能不应该开始。
3.1 跟进数据是否产生了业务价值
数据取完或者报表开发上线,不是结束,也不是结果。
一方面要去看数,发现问题,跟进解决结果。取完数据,这件事情并不是与我无瓜了,真正的业务结果达到了吗,你做的数据产生价值了吗?
另一方面,需要有主人翁意识,主动的基于数据,敏锐的洞察业务目前的痛点,又要基于业务了解,辩证的思考业务发展方向。
3.2 项目需要按节奏去复盘
项目的落地需要有明确的节奏,并且在项目跟进管理过程中,需要有复盘、汇报机制。比如汇报的机制,周报进度同步、双周项目汇报等机制,是否能按计划完成,是否有项目风险,及时投入资源解决问题。
在踩坑的历程中,曾经想要推动的缺货原因线上化,原计划是先线下收集,再归类线上化,在进行了多周多轮线下收集以后,迟迟没有规划产品线上化,其实差点就浪费了前期的工作,这是需要避免的。
3.3 听完看完需要沉淀输出,内化应用
很多新同学会抱着学校里的学习习惯,去请教经验、听分享、看书学习等通过不同的渠道输入,来丰富自己的储备。学校里往往是有考试检验你的学习成果的,你也会在考试前去重新复习。但是在工作中,往往没有非常明确的可以检验你学习成果的场景,很多时候是基于你的知识沉淀和积累,会自然而然在需要的时候有不一样的输出。在工作环境中的学习,是需要静下心去提炼、去思考、去内化的,沉淀是走心的过程。沉淀之后的小白兔,才会有厚积薄发的可能。
谨以此文,献给一年前和现在的自己,以及像我踩过这些坑也避了一些坑的同学,学会避坑,也是从“小白兔”向“小灰兔”的进化了。2021年的“小白兔”和“小灰兔”们,继续加油,未来还有更多升级迭代的可能。
作者简介
九乐(le),网易严选数据分析师,数据路上的求知者,负责严选供应链计划的分析工作。
以上是关于数据分析避坑指南-小白兔踩坑记的主要内容,如果未能解决你的问题,请参考以下文章
spoon(kettle)连接Access各种踩坑之避坑指南