数据分析该掌握的 4 板斧,常用的“套路”也要会!

Posted 网舟科技

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析该掌握的 4 板斧,常用的“套路”也要会!相关的知识,希望对你有一定的参考价值。

数据分析是当下较为热门的岗位之一,对此我是深有体会。


05 年上大学的时候,统计学专业无人问津,全班 30 多号人只有 2 人第一自愿录取,其他都是调剂过来。


等到 09 年本科毕业,统计学专业同学很少从事数据分析工作,能找到的工作更多集中在传统证券、银行等和数据稍微搭点边的综合岗位,数据分析深度和广度有限,多年后,和很多人聊起觉得价值感不强。


12 年硕士研究生毕业,互联网公司已经风生水起,除了三强 BAT 之外,也诞生出很多互联网新业态,比如 O2O、共享经济、互联网金融等,明显感觉「数据分析」岗位招聘多了起来,招聘专业要求中也渐渐多了统计学身影。


后面的故事大家就知道了,移动互联网、大数据、深度学习概念满天飞,数据分析岗位自然也成为各公司必选项。


大趋势下,未来很长一段时间数据分析岗依然会有市场,数据应用场景和边界不断外延,除了互联网、科技类公司,传统企业升级转型,拥抱互联网过程中,对数据人才的需求也极速增加。


要做一名优秀数据分析师,首先对数据分析岗位有基本的概念;其次,要明白数据分析中有哪些套路和方法,如此,才能举一反三,才能在不同场景数据分析间切换自如。顺着这几点,我们来讲讲。




逃不掉的“四要素”



任何数据分析过程都包括四大要素:场景+数据+工具+方法


数据分析起点必须来源于某个场景下的需求,根据需求目标(场景),搭建分析框架(方法),提取需要的数据指标(数据),用适合的工具实现,最后提炼结论,给出建议或策略。




1
场    景


移动互联网化+传统企业转型触网使数据获取难度大大降低,云存储和云计算使存储和计算成本降低,人工智能和商业智能使数据价值凸显,各方因素也让越来越多企业愿意花大钱于数据基础建设,由此,数据分析场景也愈发丰富。


从行业来看,主要有互联网、移动互联网、金融、汽车、房地产和供应链等。


数据分析该掌握的 4 板斧,常用的“套路”也要会!


每个行业具体业务场景也会不同,比如同样是互联网,可以分为游戏、社交、电商、安全、新零售、娱乐、外卖、航旅、共享经济、搜索、人工智能.....


应用场景和边界不断扩展,不同场景分析套路和重点也不完全相同。但有一点,场景越丰富,数据分析岗越有必要和价值,思路和想象也可无限扩展。



2
数    据


百科定义数据指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。它是可识别的、抽象的符号。


它不仅指狭义上的数字,还可以是具有一定意义的文字、字母、数字符号的组合、图形、图像、视频、音频等,也是客观事物的属性、数量、位置及其相互关系的抽象表示。


数据特征变异性和规律性,变异性是指不同事件量化的数据不同,具有差异性,正是因为数据变异性,数据分析才有必要;规律性是指包罗万象的数据中,数据是有规律可寻的,从而得出有价值的结论,正是因为规律性数据分析才有价值。


数据类型数据可分为结构性和非结构性数据。结构化数据是指可以用数字量化的,相对规整的数据,比如生产、业务、交易和客户信息等的结构化数据。数据分析和方法很长时期都集中在这类数据上,这块的方法和工具也相对成熟。


但相比结构化数据,非结构化数据存储量更大,也蕴含着非常丰富的价值,比如合约、发票、书信与采购记录等营运内容;如文书处理、电子表格、简报档案与电子邮件等部门内容;如 html 与 XML 等格式信息的 Web 内容;以及如声音、影片、图形等媒体内容。


非结构数据处理算法和方法在近几年有很大的进步,比如在图像、语音、翻译等有广泛应用。


数据简史数据规模和存储方式在 1991 年之前,增长是缓慢的,之后在互联网的推动下,数据量开始爆发。2005 年 hadoop 诞生,标志着人类对海量数据处理有了解决方案。


近几年在很多学者和企业的推波助澜下,数据价值越来越受到企业重视。



3
工    具


工欲善其事必先利其器,工具在数据分析过程中也是非常重要的一环,下面列举些常用的工具类型:


-笔记本电脑-


电脑配置还是要高点儿,尤其是在数据量比较大的公司,如果计算内存小,很容易出现死机,严重影响工作效率。


至于电脑操作系统是选择 os,还是 ws,建议选择后者,从电脑普及率来看是 ws 更高,ws 分析工具更全,功能更强大


-基础分析和展示工具-


数据分析中最常用的数据汇总和展示工具是 excel 和 ppt


excel 是最常用的数据分析工具,哪怕是在大的数据公司,比如阿里巴巴、美团、腾讯、百度,通常会先在云上把需要的指标进行初步汇总,取出放到 excel 中分析。


excel 功能很强大,除了透视汇总,图表、分类外,还有简单模型、规划求解等功能,因此,excel 是最基础也最常用的分析工具,数据分析师必须要好好掌握。


数据分析完成后,通常要把成果展示给听众,ppt 是非常好的选择。


数据分析报告 ppt 不必像营销同学做的花哨,形式为辅,核心是结论、信息传达,数据作为论据。如果能将数据分析报告类 ppt 做的很美观,也很厉害,可以参考咨询公司的报告,比如「麦肯锡」、「埃森哲」等,网上可以找到很多。


-数据提取工具-


数据提取如果数据量比较小,很多公司会有直接下载的功能,但如果数据量比较大,就需要自己加工了。


常用的数据查询工具有 sqlhive很多大的互联网公司都是用 hive,hive 和 sql 语法有点类似,也是很多数据仓库同学必须掌握的语言。


作为一名大公司的数据分析同学,hive 是必须要掌握的。hive 最早是谷歌搞出来的,不少公司在此基础上封装成自己的语言,加些自己的函数等,但总体语法和架构是一样的。


-可视化工具-


ppt 中有些可视化的功能,但在可视分析上还不是特别专业,市场上认可度比较高的可视化分析工具有 tableauspotfire 等,前者市场推广做的更好,知名度更高,后者功能更强大,可视化组件更丰富。


如果想给人耳目一新的感觉,这些可视化工具是不错的选择,而且所见即所得,tableau 和 spotfire 都收费,前者差不多 1w 左右;如果是学生,可以申请教育版的,这样可以省一笔钱。


当然,大的互联网公司也会有自己的数据产品,相对外部工具,数据接入更容易。


-高阶数据分析工具-


如果你想用一些算法、模型解决日常的工作,可以学习 R 软件、python,还有传统的一些 spss、matlab、spss modler 等


除了这些工具外,大公司也会有自己的模型或算法平台,可以通过 java、python 等语言直接调取已有算法包,也可以用这些语言重新封装新的算法再使用。


市面上工具很多,但要做一名合格的数据分析师,掌握 1/2/3 中的工具就可以解决 80% 的商业分析问题,另外20% 则还需要高阶的工具。



4
方    法


数据分析方法包括两个层面,一个是数据分析思维层面,另一个是套路层面


常用的数据分析思维有:


-MEMC-


——“相互独立、完全穷尽”,这个是金字塔原理中非常经典的复杂问题拆解方法,尤其是针对比较大的研究课题。


可能开始无从下手,这个时候通过这种方法,可以把整体分解成很多局部模块,再针对每个模块进行可能性假设和论证,最终得出满意的答案。


-归纳-


指从许多个别的事物中概括出一般性概念、原则或结论的思维方法。


每次数据分析探索可能很多维度、视角都会尝试,最终要写成分析报告的时候需要提炼核心观点,这就是一个信息归纳的过程。


-演绎-


演绎推理是由普通性的前提推出特殊性结论的推理。


我们在数据分析中经常会沿用原有的经验,很多都是采用演绎的方式进行,比如 28 法则是人类收入分配中有这种倾向,电商卖家收入也会有这种倾向。


-对比-


数据分析中很多时候要回答某个结果是好还是坏,需要有具体的参考系。


常用的参考系有四类:去年同期对比如何,上期环比如何,和目标比如何,和竞争对手比如何。只有通过对比才有实际的意义,否则只是陈列数据。


-抽茧剥丝-


数据分析要像剥洋葱一样,一层层往下分解,直接不能再分解,或者可落地解决为止,如果只停留在表象,会发现不接地气,数据无法真正驱动业务。


-5W1H-


数据分析不一定都要回答 6 方面的问题,想表达的是如何面对复杂 case,要了解这个需求的前因后果。只有先做综合性的判断,才能清楚地判断需求是否靠谱,是要接着往下做,还是要放弃,很多需求是没有意义的。


另外,通过 5W1H 方式的沟通,会获得解决方向灵感,以及判断需求所能影响的范围。


常用的套路层面,需要结合具体的业务场景比如电商流量、安全、市场营销、会员运营、销售管理等不同场景的数据分析套路是不完全一样的,下面大概讲下,后续会推出更详细的......


-流量-


常用的分析方法是流量漏斗,不管是在电商、搜索、还是在社交游戏,通过流量漏斗思路,做流量转化效率优化都是这块的核心。


-安全-


最主要的思路是攻防(规则识别、模型识别),流程或政策优化。


比如针对账号被盗这样的风险,可以在登录时增加校验流程,或者增加校验难度,也可在不改变流程情况下,提高规则、模型对异常攻击识别的准确率和覆盖度。


原则要做安全和用户体验平衡。


-成交-


成交很重要的思路是从流量端做成交驱动拆解,成交金额=uv*转化率*客单价,每个指标都可以再细分,也可以从供给端做供给数量和效率拆解,再从不同维度细分,比如行业、商家类型等。


-用户-


用户主要关注的是用户粘性,和 ARUP 值,常用的方法是 RFM,将用户分成不同类型精细化运营,终极目标是让用户离不开你,情愿花更多钱。


-销售管理-


销售核心的工作是 KPI 制定和分配,佣金激励,过程管理,数据分析更多是 KPI 制定的方法,佣金系数制定的方法,过程指标分解的方法。


-市场营销-


市场营销核心分析思路是影响面,以及投入产出比(ROI)。

-END-


来源:互联网

免责声明:部分文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。本声明未涉及的问题参见国家有关法律法规,当本声明与国家法律法规冲突时,以国家法律法规为准。


长按上方二维码识别



【网舟科技】

网舟联合科技(北京)有限公司,官网(www.eship.com.cn)成立于2004年,注册资金2000万元,目前拥有13年互联网大数据服务经验,公司长期专注于金融保险、通信、互联网、旅游酒店等行业的电子渠道大数据运营,为客户提供全球领先的电子渠道转型咨询、大数据挖掘和应用定制服务,助力客户互联网转型,提升数字化运营和数据营销能力。


网舟科技是Adobe数字营销的全球解决方案级合作伙伴,具备一流的数字营销一体化解决方案能力。




以上是关于数据分析该掌握的 4 板斧,常用的“套路”也要会!的主要内容,如果未能解决你的问题,请参考以下文章

数据分析报告的框架——既要懂分析,也要会讲故事

神牛们,noip一等究竟需要掌握哪些内容啊?

数说| 数据分析学习平台

吴军硅谷来信《三板斧破四困境》

(不仅需要会使用svn,也要会使用git命令行)

玩好.NET高级调试,你也要会写点汇编