什么是KS检验?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了什么是KS检验?相关的知识,希望对你有一定的参考价值。
近几天在做R软件的作业,画一个图要求做KS检验,什么是KS检验呢?
参考技术A 全称是Kolmogorov-Smirnov检验(柯尔莫哥洛夫-斯摩洛夫),用来检验你的数据的分布是不是符合一个理论的已知分布。也就是说你的原假始是H0: F=F0.具体计算要用到经验分布函数:Fn(x)=1/n SUM_i=1^n IXi<=x,
以此来计算检验统计量
D=sup_x | Fn(x)-F0(x)|, sup可以换成MAX.
用这个公式手算也可以得到答案的。
什么是K-S检验
Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法。其原假设H0:两个数据分布一致或者数据符合理论分布。D=max|f(x)-
g(x)|,当实际观测值D>D(n,α)则拒绝H0,否则则接受H0假设。KS检验与t-检验之类的其他方法不同是KS检验不需要知道数据的分布情况,可以算是一种非参数检验方法。当然这样方便的代价就是当检验的数据分布符合特定的分布事,KS检验的灵敏度没有相应的检验来的高。在样本量比较小的时候,KS检验作为非参数检验在分析两组数据之间是否不同时相当常用。
假定两个样本的样本量分别为n1和n2,用F1(X)和F2(X)分别表示两个样本的累积经验分布函数。再记Dj=F1(Xj)-F2(Xj)。检验统计量近似正态分布,表达式为:Z=max|
Dj
|根号下(n1n2/(n1+n2))
方法步骤是:
(1)令f(x)为假设所特定的理论累积分布函数;
(2)令sn(x)为n个观察值的样本累积函数。对每一个观察值x,sn(x)=k/n,k是小于或等于x的观察例数;
(3)确定最大距离D,定义为:
D=max|f(x)-sn(x)|
检验假设H0:
f(x)=sn(x)
备择假设H1:
(4)对于选定的显著水平,如果D值等于或大于附表的临界值,则拒绝原假设 参考技术A Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法。其原假设H0:两个数据分布一致或者数据符合理论分布。D=max| f(x)- g(x)|,当实际观测值D>D(n,α)则拒绝H0,否则则接受H0假设。KS检验与t-检验之类的其他方法不同是KS检验不需要知道数据的分布情况,可以算是一种非参数检验方法。当然这样方便的代价就是当检验的数据分布符合特定的分布事,KS检验的灵敏度没有相应的检验来的高。在样本量比较小的时候,KS检验作为非参数检验在分析两组数据之间是否不同时相当常用。
假定两个样本的样本量分别为n1和n2,用F1(X)和F2(X)分别表示两个样本的累积经验分布函数。再记Dj=F1(Xj)-F2(Xj)。检验统计量近似正态分布,表达式为:Z=max| Dj |根号下(n1n2/(n1+n2))
方法步骤是:
(1)令f(x)为假设所特定的理论累积分布函数;
(2)令sn(x)为n个观察值的样本累积函数。对每一个观察值x,sn(x)=k/n,k是小于或等于x的观察例数;
(3)确定最大距离D,定义为:
D=max|f(x)-sn(x)|
检验假设H0: f(x)=sn(x)
备择假设H1:
(4)对于选定的显著水平,如果D值等于或大于附表的临界值,则拒绝原假设 参考技术B K-S检验是统计学中在对一组数据进行统计分析是所用到的一种方法。它是将需要做统计分析的数据和另一组标准数据进行对比,求得它和标准数据之间的偏差的方法。一般在K-S检验中,先计算需要做比较的两组观察数据的累积分布函数,然后求这两个累积分布函数的差的绝对值中的最大值D。最后通过查表以确定D值是否落在所要求对应的置信区间内。若D值落在了对应的置信区间内,说明被检测的数据满足要求。反之亦然。
以上是关于什么是KS检验?的主要内容,如果未能解决你的问题,请参考以下文章