为啥在假设检验中,p-value值小于0.05是反对H0?不是应该相反么?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了为啥在假设检验中,p-value值小于0.05是反对H0?不是应该相反么?相关的知识,希望对你有一定的参考价值。
先说一下那个显著水平没学过,不懂,尽量不要用那个解释。
我的疑问就是p-value是通过H1的数算出来的值,那么,算出来的p-vaule 不是应该 越大越支持h1么 ?但为什么是 小于0.05才支持h1?
先假设H0成立,再通过样本实际算出一个统计值(比如Mu)。如果发现这个值所代表的p值很小,则说明H0成立的情况下,这个值出现的机会很小。这时就认为H0不对,拒绝H0,也就是接受H1.
举例来说,某人告诉你一个鱼塘里鱼很多。你想通过实验看他说的对不对。
于是H0:该鱼塘鱼很多。H1:该鱼塘鱼不多。
然后你捞鱼,捞了10次,才捞2条。
你觉得说如果鱼多的话,我怎么只捞两条呢?捞两条或者更少的机会很小的。
那么一定是那个人告诉你的事实不对。
于是你就拒绝接受他的说法,转而相信H1,鱼不多。
这个捞两条或更少的机会就是P。P越小,你越有信心拒绝H0。比如你一条没捞到,你就更不信H0,接受H1。
P就是信心的问题。假设是3%,那么你3%的相信H0是对的,97%是不对的。 参考技术A p值的意思是“拒绝原假设的最小概率”,p<0.05,表明最小拒绝概率比置信水平(置信水平就是认为确定的一个标准)还低,则拒绝原假设。
如果你高数学得好的话,你会发现对概率密度函数在“原假设成立时的统计量值”到正无穷大区间上的定积分就是p值,它可以看作密度函数左侧(有时是右侧或双侧)的和坐标轴围成的一部分面积,此面积和置信水平围成的相应面积存在覆盖或被覆盖的关系,根据这种关系就可以判断拒绝还是接受。
假设检验中的P值 与显著性水平的联系
欢迎关注本人:
推荐系统公众号:Tiany_RecoSystem
知乎主页:https://www.zhihu.com/people/shen-xiao-ming-77
假设检验是推断统计中的一项重要内容。用SAS、SPSS等专业统计软件进行假设检验,在假设检验中常见到P值( P-Value,Probability,Pr),P值是进行检验决策的另一个依据。 P值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值,一般以P < 0.05 为显著, P<0.01 为非常显著,其含义是样本间的差异由抽样误差所致的概率小于0.05 或0.01。实际上,P值不能赋予数据任何重要性,只能说明某事件发生的机率。统计结果中显示Pr > F,也可写成Pr( >F),P = P F0.05 > F或P = P F0.01 > F。中文名
假设检验中的P值
属 于
推断统计
用 到
SAS、SPSS等
P 值
即概率
目录
P值由来
编辑 从某总体中抽 原因1:这一样本是由该总体抽出,其差别是由抽样误差所致; 原因2:这一样本不是从该总体抽出,所以有所不同。 如何判断是那种原因呢?统计学中用显著性检验来判断。其步骤是: ⑴、建立检验假设(又称无效假设,符号为H0):如要比较A药和B药的疗效是否相等,则假设两组样本来自同一总体,即A药的总体疗效和B药相等,差别仅由抽样误差引起的碰巧出现的。 ⑵、选择适当的统计方法计算H0成立的可能性即概率有多大,概率用P值表示。 ⑶、根据选定的显著性水平(0.05或0.01),决定接受还是拒绝H0。如果P>0.05,不能否定“差别由抽样误差引起”,则接受H0;如果P<0.05或P <0.01,可以认为差别不由抽样误差引起,可以拒绝H0,则可以接受另一种可能性的假设(又称备选假设,符号为H1),即两样本来自不同的总体,所以两药疗效有差别。数学应用
编辑数据解释
P值 | 碰巧的概率 | 对无效假设 | 统计意义 |
P>0.05 | 碰巧出现的可能性大于5% | 不能否定无效假设 | 两组差别无显著意义 |
P<0.05 | 碰巧出现的可能性小于5% | 可以否定无效假设 | 两组差别有显著意义 |
P <0.01 | 碰巧出现的可能性小于1% | 可以否定无效假设 | 两者差别有非常显著意义 |
注意要点
理解P值,下述几点必须注意: ⑴P的意义不表示两组差别的大小,P反映两组差别有无统计学意义,并不表示差别大小。因此,与对照组相比,C药取得P<0.05,D药取得P <0.01并不表示D的药效比C强。 ⑵ P>0.05时,差异无显著意义,根据统计学原理可知,不能否认 无效假设,但并不认为无效假设肯定成立。在药效统计分析中,更不表示两药等效。哪种将“两组差别无显著意义”与“两组基本等效”相同的做法是缺乏统计学依据的。 ⑶统计学主要用上述三种P值表示,也可以计算出确切的P值,有人用P <0.001,无此必要。 ⑷ 显著性检验只是统计结论。判断差别还要根据专业知识。抽样所得的样本,其 统计量会与 总体参数有所不同,这可能是由于两种原因。计算方法
编辑 (1) P值是: 1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。 2) 拒绝原假设的最小 显著性水平。 3) 观察到的(实例的)显著性水平。 4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。 (2) P值的计算: 一般地,用X 表示检验的统计量,当H0为真时,可由样本数据计算出该统计量的值C,根据 检验统计量X的具体分布,可求出P值。具体地说: 左侧检验的P值为检验统计量X 小于样本统计值C 的概率,即:P = P X < C 右侧检验的P值为检验统计量X 大于样本统计值C 的概率:P = P X > C 双侧检验的P值为检验统计量X 落在样本统计值C 为端点的尾部区域内的 概率的2 倍:P = 2P X > C (当C位于分布曲线的右端时) 或P = 2P X< C (当C 位于分布曲线的左端时) 。若X 服从 正态分布和t分布,其分布曲线是关于纵轴对称的,故其P 值可表示为P = P| X| > C 。 计算出P值后,将给定的显著性水平α与P 值比较,就可作出检验的结论: 如果α > P值,则在显著性水平α下拒绝原假设。 如果α ≤ P值,则在显著性水平α下接受原假设。 在实践中,当α = P值时,也即 统计量的值C刚好等于临界值,为慎重起见,可增加 样本容量,重新进行抽样检验。以上是关于为啥在假设检验中,p-value值小于0.05是反对H0?不是应该相反么?的主要内容,如果未能解决你的问题,请参考以下文章