3分钟,看懂假设检验

Posted 码工小熊

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了3分钟,看懂假设检验相关的知识,希望对你有一定的参考价值。

  \'3分钟,看懂假设检验_数据分析\'

 

大家好,我是爱学习的小xiong熊妹。

 

今天来说说假设检验。这是个古老的方法,近年ABtest大行其道,使假设检验方法迎来了新一波文艺复兴,搞得很多小伙伴都在问:如何做假设检验?那一堆似懂非懂的统计符号啥意思?

 

今天小熊妹帮大家整理了一个懒人攻略,大家抄起来用即可。可能有描述不准确的地方,大神们勿喷哦。

 

一、假设检验是干什么的?

假设检验最常见的场景有两个:

 

\'3分钟,看懂假设检验_数据分析_02\'

 

总之是吵架必备,怼人利器。

 

二、什么时候适合用假设检验?

当错误很明显的时候,不需要做假设检验。比如销售、运营的表现不好,可以直接取过往X天的销售业绩、运营指标来看。如果销售业绩一直下滑,还有啥好说的,这时候不需要假设检验,直接开怼。

 

有些问题不那么明显,比如上边吐槽的产品寿命问题。除非产品用到烂,否则不知道寿命是多少。而当用户遇到产品寿命很短的问题的时候,他们只会默默换牌子,也很少投诉“不耐用”。此时必须做抽样检测,就得用到假设检验方法。

 

在论证新点子很好的时候,也需要先把新点子做出来,再做小范围测试。此时也要用假设检验方法。总之,假设检验方法适合于抽样检验/小范围测试的场景。

 

三、假设检验是怎么验的?

众所周知:证伪比证真容易多了。证真要穷尽各种可能,证伪只要找到反例即可。假设检验的基本思路也是如此,它利用了“小概率事件,不可能在一次小范围抽样中发生”的朴素原理,先提一个假设,之后看能否用小概率事件推翻它。能推翻的,就说明假设不成立;不能推翻,就至少说明不能推翻(是否接受假设,可以再验证)。

 

基于这个原理,我们一般把要怼翻的结论,作为原假设。然后试着去怼翻它!(如下图)

 

\'3分钟,看懂假设检验_统计学_03\'

 

很多小伙伴在这里犯迷糊:到底原假设是啥?最简单的判断方法,就是:想怼翻什么,就把什么放原假设(记得带等号的一定在原假设)。不过实践的时候,还是经常会写错,这里需要多加练习才行。

 

设定原假设以后,还要设定“小概率事件”到底有多小。一般用显著性水平α来表示。α是一个人工给定的数,一般给0.10,0.05,0,01看起来够小就行。

 

四、得到假设以后怎么操作?

得到假设后,需要选择合适的检验统计量,代入参数,计算是否属于小概率事件。

 

检验统计量,和要检验的假设有关系。比如上述产品使用寿命问题,是一个典型的单总体(只有一个产品要检验)+均值(使用寿命,指的是待检测产品的平均寿命)检验问题,因此可以选用t检验。如果是比例检验问题(比如检验产品的合格率,合格率=问题样本/全部抽检样本),则可以使用Z统计量(如下图)

 

\'3分钟,看懂假设检验_数据分析_04\'

 

有了统计量以后,可以检验是否属于小概率事件。不同的假设,拒绝不同

 

\'3分钟,看懂假设检验_数据分析_05\'

 

关于拒绝区域,有个简单的记忆方法,就是:

  1. 如果假设是等号,拒绝区域就是左右两侧。潜台词就是:既然咱俩相等,那检验值应该不大不小才对。
  2. 如果假设是小于号,拒绝区域就是右侧。潜台词就是:既然你比我小,那检验值肯定不太大呀
  3. 如果假设是大于号,拒绝区域就是左侧。潜台词就是:既然你比我大,那检验值肯定不能太小呀

这样就容易区分了

 

当然,有很多统计软件/算法直接给了P值,大家记得:P值小于0.05就拒绝原假设即可。

 

五、看个简单的例子

某产品经理宣称,目标用户80%都是年轻人(25岁以下),现随机抽样200人,发现146名年龄在25岁以下,问:我们能怼翻产品经理的结论不?

 

解答过程如下:

 

\'3分钟,看懂假设检验_数据分析_06\'

 

原假设被拒绝掉了,我们可以认为产品经理在吹逼,打完收工!

 

六、从假设检验到ABtest

实际上,假设检验的类型很丰富。为了小伙伴们理解方便,上边举的是最简单的单总体问题。单总体问题,常见于已经有了一个预设结论,之后推翻这个结论的情况。比如证明新版本A比老版本的数据好看。

 

我们常说的ABtest,如果是真的是设计两个版本A版和B版,之后再检验AB版的区别,则涉及2个总体的均值/比例检验,需要用到不同的统计量。

 

以上检验均值/比例的方法,统称参数检验,还有非参数检验,比如检验身高和体重之间是否有关系。这些方法在实际工作中有不同的应用场景,之后再慢慢介绍吧。

 

今天的分享就到这里,如果没听懂也没关系,后续小熊妹还是会努力讲清楚的。喜欢的话,记得转发+在看+点赞,支持下小熊妹哦,谢谢大家。

 

以上是关于3分钟,看懂假设检验的主要内容,如果未能解决你的问题,请参考以下文章

DataWhale概率统计3——常见分布与假设检验

AB测试原理(二)假设检验(参数方法)

统计学基础之假设检验

假设检验法

sas单组数据均值为0的假设检验用啥过程

SPSS假设检验