Python气象数据处理与绘图(4)：显著性检验

Posted 2023-04-11

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Python气象数据处理与绘图(4)：显著性检验相关的知识，希望对你有一定的参考价值。

参考技术A 其实在(2)中已经提到了相关系数和回归系数，在计算过程中，直接返回了对应的p-value，因此可以直接使用p-value。

计算两个独立样本得分均值的T检验。
这是对两个独立样本具有相同平均值（预期值）的零假设的双边检验。此测试假设默认情况下总体具有相同的方差。在合成分析中通常用到t-test。

当a,b为变量场时，即[time,lat,lon]时，a,b两个数组的经纬度需相同。
nan_policy 可选‘propagate’, ‘raise’, ‘omit’
“propagate”：返回nan
“raise”：报错
“omit”：执行忽略nan值的计算

计算得到的P值用于绘图，当p<0.01时，通过99%显著性检验，p<0.05，通过95%显著性检验，以此类推。
图形绘制只需在原有填色图上叠加打点图层,实际上打点也是特殊的图色，只不过将颜色换成了点，实际上用到的还是contourf函数。

通过contourf对应参数调节打点图层的细节。

假设检验中的P值与显著性水平的联系

欢迎关注本人：

推荐系统公众号：Tiany_RecoSystem

知乎主页：https://www.zhihu.com/people/shen-xiao-ming-77

假设检验是推断统计中的一项重要内容。用SAS、SPSS等专业统计软件进行假设检验，在假设检验中常见到P值( P-Value，Probability，Pr)，P值是进行检验决策的另一个依据。 P值即概率，反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值，一般以P < 0.05 为显著， P<0.01 为非常显著，其含义是样本间的差异由抽样误差所致的概率小于0.05 或0.01。实际上，P值不能赋予数据任何重要性，只能说明某事件发生的机率。统计结果中显示Pr > F，也可写成Pr( >F)，P = P F0.05 > F或P = P F0.01 > F。

中文名

假设检验中的P值

属于

推断统计

用到

SAS、SPSS等

P 值

即概率

P值由来

编辑从某总体中抽 原因1：这一样本是由该总体抽出，其差别是由抽样误差所致； 原因2：这一样本不是从该总体抽出，所以有所不同。 如何判断是那种原因呢？统计学中用显著性检验来判断。其步骤是： ⑴、建立检验假设（又称无效假设，符号为H0）：如要比较A药和B药的疗效是否相等，则假设两组样本来自同一总体，即A药的总体疗效和B药相等，差别仅由抽样误差引起的碰巧出现的。 ⑵、选择适当的统计方法计算H0成立的可能性即概率有多大，概率用P值表示。 ⑶、根据选定的显著性水平（0.05或0.01），决定接受还是拒绝H0。如果P>0.05，不能否定“差别由抽样误差引起”，则接受H0；如果P<0.05或P <0.01，可以认为差别不由抽样误差引起，可以拒绝H0，则可以接受另一种可能性的假设（又称备选假设，符号为H1），即两样本来自不同的总体，所以两药疗效有差别。

数学应用

编辑

数据解释

P值	碰巧的概率	对无效假设	统计意义
P>0.05	碰巧出现的可能性大于5%	不能否定无效假设	两组差别无显著意义
P<0.05	碰巧出现的可能性小于5%	可以否定无效假设	两组差别有显著意义
P <0.01	碰巧出现的可能性小于1%	可以否定无效假设	两者差别有非常显著意义

注意要点

理解P值，下述几点必须注意： ⑴P的意义不表示两组差别的大小，P反映两组差别有无统计学意义，并不表示差别大小。因此，与对照组相比，C药取得P<0.05，D药取得P <0.01并不表示D的药效比C强。 ⑵ P>0.05时，差异无显著意义，根据统计学原理可知，不能否认无效假设，但并不认为无效假设肯定成立。在药效统计分析中，更不表示两药等效。哪种将“两组差别无显著意义”与“两组基本等效”相同的做法是缺乏统计学依据的。 ⑶统计学主要用上述三种P值表示，也可以计算出确切的P值，有人用P <0.001，无此必要。 ⑷ 显著性检验只是统计结论。判断差别还要根据专业知识。抽样所得的样本，其统计量会与总体参数有所不同，这可能是由于两种原因。

计算方法

编辑 (1) P值是： 1) 一种概率，一种在原假设为真的前提下出现观察样本以及更极端情况的概率。 2) 拒绝原假设的最小显著性水平。 3) 观察到的(实例的)显著性水平。 4) 表示对原假设的支持程度，是用于确定是否应该拒绝原假设的另一种方法。 (2) P值的计算： 一般地，用X 表示检验的统计量，当H0为真时，可由样本数据计算出该统计量的值C，根据检验统计量X的具体分布，可求出P值。具体地说：左侧检验的P值为检验统计量X 小于样本统计值C 的概率，即：P = P X < C 右侧检验的P值为检验统计量X 大于样本统计值C 的概率：P = P X > C 双侧检验的P值为检验统计量X 落在样本统计值C 为端点的尾部区域内的概率的2 倍：P = 2P X > C (当C位于分布曲线的右端时) 或P = 2P X< C (当C 位于分布曲线的左端时) 。若X 服从正态分布和t分布，其分布曲线是关于纵轴对称的，故其P 值可表示为P = P| X| > C 。 计算出P值后，将给定的显著性水平α与P 值比较，就可作出检验的结论： 如果α > P值，则在显著性水平α下拒绝原假设。 如果α ≤ P值，则在显著性水平α下接受原假设。 在实践中，当α = P值时，也即统计量的值C刚好等于临界值，为慎重起见，可增加样本容量，重新进行抽样检验。

以上是关于Python气象数据处理与绘图(4)：显著性检验的主要内容，如果未能解决你的问题，请参考以下文章

R语言可视化分面图多变量分组多水平t检验可视化多变量分组多水平分面条形图（faceting bar plot）并添加显著性水平在标签和绘图上边框之间添加15%的空格添加抖动数据点

R语言与显著性检验学习笔记

回归方程显著性检验检验统计量怎么看

R语言可视化分面图多变量分组多水平t检验可视化多变量分组多水平分面箱图（faceting boxplot）并添加显著性水平在标签和绘图上边框之间添加15%的空格

SPSS非参数检验差异显著，但成对比较都不显著，怎么解释？

在回归分析中,部分系数没有通过显著性检验,该如何处理?