非参数分析-符号秩和检验法

Posted 炫云云

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了非参数分析-符号秩和检验法相关的知识,希望对你有一定的参考价值。


如果随机变量 X X X 的密度函数 f ( x ) f(x) f(x) 是偶函数,则 X X X 的分布关于原点 0 对称. 关于原点0 对称的分布满足条件:对任意的实数 a > 0 a>0 a>0,都有 P ( X > a ) = P ( X < − a ) P(X>a)=P(X<-a) P(X>a)=P(X<a). 如果 f ( x ) f(x) f(x) 是密度函数,不难证明 f ( x − θ ) f(x-\\theta) f(xθ) 也是密度函数. 所以在密度函数 f ( x ) f(x) f(x) 为偶函数时 f ( x − θ ) f(x-\\theta) f(xθ) 是关于点 θ \\theta θ 对称的密度函数. 如果随机变量 X X X 的密度函数关于点 θ \\theta θ 对称, 则 X X X 的分布关于点 θ \\theta θ 对称. 关于点 θ \\theta θ 对称的分布满足条件: 对任意的实数 a > 0 a>0 a>0,都有 P ( X > θ + a ) = P ( X < θ − a ) . P(X>\\theta+a)=P(X<\\theta-a) . P(X>θ+a)=P(X<θa). 本节 讨论对称中心 θ \\theta θ 的检验问题.

对称中心为原点的检验问题

上一节我们将成对数据的比较问题归结为对称中心 θ \\theta θ 是否为原点 0 的检验问题. 这个检验问题的一般提法如下.假设样本 x 1 , x 2 , ⋯   , x n x_{1}, x_{2}, \\cdots, x_{n} x1,x2,,xn 独立同分布,总体 X X X 服从连续型分布,且 X X X 的分布关于点 θ \\theta θ 对称, 其密度函数为 f ( x − θ ) , f ( f(x-\\theta), f( f(xθ),f( ) ) ) 是偶 函数. 我们假设总体服从连续型分布只是为了理论讨论的方便,在实际应用时不必拘泥于这个假设是否成立,对于离散型分布也可以使用符号秩和检验方法. 对称中心 θ \\theta θ 是否为原点 0 的检验问题的原假设和备择假设有三种情况. 它们的原假设 H 0 H_{0} H0 都是对称中心 θ \\theta θ 为原点, 即 θ = 0 , \\theta=0, θ=0, 而备择假设 H 1 H_{1} H1 分别是 θ > 0 , θ < 0 \\theta>0, \\theta<0 θ>0,θ<0 θ ≠ 0. \\theta \\neq 0 . θ=0. 显然,若 X X X 的分布关于点 θ \\theta θ 对称,则 X X X 的均值和中位数相同,都等于 θ . \\theta . θ. 所以对称中心 θ \\theta θ 是否为原点的检验问题,可以转化为中位数 θ \\theta θ 是否等于 0 的检验问题. 因此符号检验可用于对称中心 θ \\theta θ 是否为原点的检验问题.但符号检验并没有充分运用分布是对称分布的信息, 它并不能有效地解决对称中心 θ \\theta θ 是否为原
点的检验问题. 符号秩和检验方法作为符号检验的改进,它能有效地解决对称中心 θ \\theta θ 是否为原点的检验问题.

关于对称中心 θ \\theta θ 是否为原点的检验问题,符号检验统计量为
S + = ∑ i = 1 n u i , u i = { 1 , x i > 0 , 0 ,  否则  , i = 1 , 2 , ⋯   , n . S^{+}=\\sum_{i=1}^{n} u_{i}, u_{i}=\\left\\{\\begin{array}{ll} 1, & x_{i}>0, \\\\ 0, & \\text { 否则 }, \\end{array} \\quad i=1,2, \\cdots, n .\\right. S+=i=1nui,ui={1,0,xi>0, 否则 ,i=1,2,,n.
显然 , S + , S^{+} ,S+ 仅使用了样本数据是正数还是负数的信息,而没有使用样本数据的值有多大或多小的信息. 符号秩和检验方法之所以是符号检验的改进,就因为它还用到了样本数据值的大小的信息. 首先将样本的绝对值 ∣ x 1 ∣ , ∣ x 2 ∣ , ⋯   , ∣ x n ∣ \\left|x_{1}\\right|,\\left|x_{2}\\right|, \\cdots,\\left|x_{n}\\right| x1,x2,,xn 按由小到大的次序排列. 由于总体服从连续型分布,不妨假设样本 x 1 , x 2 , ⋯   , x n x_{1}, x_{2}, \\cdots, x_{n} x1,x2,,xn 互不相等,都不等于 0 , 0, 0, 且样本的绝对值 ∣ x 1 ∣ , ∣ x 2 ∣ , ⋯   , ∣ x n ∣ \\left|x_{1}\\right|,\\left|x_{2}\\right|, \\cdots,\\left|x_{n}\\right| x1,x2,,xn 也互不相等. 为此我们假设 ∣ x 1 ∣ , ∣ x 2 ∣ , ⋯   , ∣ x n ∣ \\left|x_{1}\\right|,\\left|x_{2}\\right|, \\cdots,\\left|x_{n}\\right| x1,x2,,xn 由小到大排列成 z ( 1 ) < z ( 2 ) < ⋯ < z ( n ) . z_{(1)}<z_{(2)}<\\cdots<z_{(n)} . z(1)<z(2)<<z(n). ∣ x i ∣ = z ( R i ) , \\left|x_{i}\\right|=z_{\\left(R_{i}\\right)}, xi=z(Ri), 则称 ∣ x i ∣ \\left|x_{i}\\right| xi 的秩为 R i , R i

以上是关于非参数分析-符号秩和检验法的主要内容,如果未能解决你的问题,请参考以下文章

python 数据分析不同情况下的t检验Wilcoxon符号秩检验Wilcoxon秩和检验卡方检验Fisher检验

单细胞数据分析中的秩和检验与t检验

统计 | R语言执行两组间差异分析Wilcox秩和检验

数据分析-非参数秩方法

参数检验和非参数检验简介

数据分析-非参数秩方法