数据分析有什么用
Posted 余晟以为
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析有什么用相关的知识,希望对你有一定的参考价值。
今天,我想再多讲讲。
前些日子我们在工作中见到一份诡异的报告:一个页面,不管有没有使用加速方案,全国各地多个节点访问的平均速度都没什么差别,一直保持在0.6秒左右,甚至使用加速方案之后还要慢一点点。数据确实是客观的,数据也不会骗人。但是,大自然的逻辑更不可能骗人。如果数据和逻辑无法保持一致,很可能是数据的处理和解读出了问题,所以得到“无法解释”的数据。
这个0.6秒就是如此,大家一开始猜测了半天,都无法给出信服的解释。最后有人提出应当看看详细的数据。仔细拉出来之后一看,大部分节点的访问速度都很快,在0.2秒之内就可以完成,唯独有一个偏远地区的节点,访问时间接近30秒。这样一切就可以解释清楚了,如果页面本身的响应时间已经足够快,加速方案对它的影响很可能是微乎其微的。如果大部分响应时间都在0.2秒以内,却出现了一个30秒的异数,算数平均之后得到0.6秒也就不足为怪了。
在这种情况下,P99(排名在99%的记录时长,表示99%的访问都可以在这个时间内完成)之类的数据指标,明显强于简单的算数平均。
许多年前我还遇到过一个诡异的例子。每天晚上11点左右服务器的负载就暴涨,但是无论是负责业务服务还是负责数据统计的同事,都说自己的程序没问题(当时服务器很紧张,各种程序共用的)。考虑到业务服务程序全天都不太可能有变化,怀疑点应当在数据统计程序上。可是,从数据统计上看,又没有任何异样,而且数据量也不大,几十万不到上百万,应当不会造成这么高的负载。
我花了一晚上蹲守之后终于发现了问题:数据统计程序是没有问题,但对应的crontab脚本写错了。本来应该是11:00分开始数据导入再统计,结果写成了11点的每一分钟都进行数据导入再统计…… 所以数据量一下从几十万上升到了几千万,偏生这个统计的结果是比例和增量,没有绝对数字,所以数据量原样放大60倍,比例和增量并不会变化…… 这虽然是程序代码的问题,但也提醒我们,只看比例和增量,可能漏过重要的问题。
除了数据的处理和解读,数据内部的逻辑也相当重要。我之前写过马蜂窝的数据事件,如果各种数据是真实的,那么哪怕没有从程序上约束,它的内部也一定是有逻辑,可以互相印证的的。
如果是个社区网站,用户留下的评论数量,一定和用户注册、登录等等行为数据之间有稳定的关联。如果用户的注册、登录数量不涨,只有评论飞涨,或者注册、登录数据飞涨,而评论、互动保持不动,那数据多半有问题。
同样的,用户留下评论的时间分布,以及注册、登录的时间分布,一定和普通人的行为模式相符合。如果用户的注册和登录时间平均分布在全天24小时,或者评论的时间高度集中在某些时间段,那数据也多半有问题。
最近一两年,“数据科学家”成了热捧的对象,大家也开始重视数据体系,重视还原数据内部的逻辑了,这是好事。但我同时也认为,数据不只是数据科学家的事情。
只要你在多人合作的组织里,数据很可能就是能帮大家对齐差异、达成共识的通用标准。关心数据、了解数据、懂得解读数据,这些能力不只是你的防身利器,抵挡各种不合理的指责,更可能成为指引未来工作的灯塔,发现真正的价值所在。
下一次人家拿一个决策来让你执行的时候,你可以问:你们是怎么判断的,计算依据在哪里呢?
下一次人家拿一个数据指标来指责你的时候,你可以问:你们的指标体系是怎么样的,权重如何分配?这里的数据低了,在整体中占多大比重?因果关系是确认的吗?
下一次计划未来工作的时候,你可以问:我们真的对准了最有价值的点了吗?如果成功了,如何用数据验证我们确实成功了?会不会有其它的连带影响?
其实,这些运用数据的能力并没有那么高不可攀,普通人积累了有足够的经验,或者经过专门的培训,也可以在其中发挥重要作用。
如果你觉得自己数据分析的能力偏弱,缺乏完整的分析思维和逻辑,不妨参与网易云课堂明天(1月17日)推出的免费直播公开课。来自 网易严选 的商业分析负责人 珍妮同学 将与大家分享如何设计一个高可用的数据评估体系,同时还限时推出以下免费福利:
PART 1 免费直播公开课
直播主题
▼
《如何设计一个高可用的数据评估体系》
<1月17日 周四 20:00>
直播讲师
▼
珍妮 网易严选商业分析负责人
直播大纲
▼
引子:从高考3+3体制改革说起
一个思维模型:OSLAS
一个应用案例:商品评级体系
生活小感悟:无数学,不生活
PART 2 免费体验课
你能收获什么
▼
快速了解电商业务,学习行业大厂方法论
提升数据分析技法,拓展业务应用能力
从方法论到实战案例,进阶电商数据分析师
PART 3 获取方式
扫码进群即可领取所有福利
群号:931630461
席位有限,先到先得~
点击阅读原文,一键领取福利!
以上是关于数据分析有什么用的主要内容,如果未能解决你的问题,请参考以下文章