Kolmogorov–Smirnov test(KS)
Posted webrobot
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Kolmogorov–Smirnov test(KS)相关的知识,希望对你有一定的参考价值。
(三)KS检验
将KS检验应用于信用评级模型主要是为了验证模型对违约对象的区分能力,通常是在模型预测全体样本的信用评分后,将全体样本按违约与非违约分为两部分,然后用KS统计量来检验这两组样本信用评分的分布是否有显著差异。
两条曲线算的是累计概率
计算各阶段的差值
最后算差值的最大值
KS检验也常用来选择有预测能力的单变量。就是通过某个单变量把样本分成两组,看这两组的样本有关KS指标的大小来决定此变量的预测能力。
模型应该要能区别出违约户和正常户之间的差异,违约户的评级分配应当不同于正常户的评级分配。运用KS检验来验证模型能否区别出违约户与正常户,当两组样本的累积相对次数分配非常接近,且差异为随机时,则两组样本的评级分配应为一致;反之当两组样本的评级分配并不一致时,样本累积相对次数分配的差异会很显,如下图所示:
KS检验模型区分能力
对总体十等分,并按照违约率降序排序,计算每一等分中违约与正常百分比的累计分布,绘制出两者差异
KS的检验步骤为:
KS值越大,表示模型能够将正、负客户区分开的程度越大。
通常来讲,KS>0.2即表示模型有较好的预测准确性。
1、计算正常户和违约户在各评分阶段下的累积比率
2、 计算各阶段累积比率之差
3、 找出最大的累积比率之差,即为KS
另外,下表为KS值对应违约区别能力:
假设模型分数有0-1000分
分数分为10个阶段
一阶段:0-100分
二阶段:100-200分
三阶段:200-300分
.........
十阶段:900-1000分
计算每个阶段坏客户累积占比和好客户累积占比,例如第五阶段,坏客户累积占比34%,好客户累积占比81%,差值47.4%,最大
47%超过阈值20%,模型区分能力非常强
KS临界值表
www.cust.edu.tw/mathmet/KS-critical.docx
以上是关于Kolmogorov–Smirnov test(KS)的主要内容,如果未能解决你的问题,请参考以下文章
Poisson Kolmogorov Smirnov 关系警告