相关系数之皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数(评价线性关系的相关系数)(第二部分)

Posted 衾许°

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了相关系数之皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数(评价线性关系的相关系数)(第二部分)相关的知识,希望对你有一定的参考价值。

前言

接上一部分的算出person相关系数了,接下来该干嘛呢?..

正常人会怎样,应该会去算相关系数可不可靠?那咋验算呢?

对皮尔逊相关系数进行假设检验(全是字,人都麻了)

第一步:提出原假设H0和备择假设H1,并且两个假设截然相反

假设我们计算出了一个person相关系数r,我们想检验它是否显著的异常于0,那么我们可以这样设定原假设和备择假设,H0:r = 0,H1:r !=0.

第二步:在原假设成立的条件下,利用我们要检验的量构造出一个符合某一分布的统计量,对于person相关系数r而言,在满足一定条件下,我们可以构造统计量

可以证明t是服从自由度为n-2的t分布

第三步:将我们要检验的这个值带入这个统计量中,可以得到一个特定的值(检验值)

假设我们计算出来的person相关系数是0.5,样本量为30,那我们就可以得到t=0.5*((30-2)/(1-0.5^2))^1/2 = 3.05505

第四步:由于我们知道统计量的分布情况,因此我们可以画出该分布的概率密度函数pdf,并给定一个置信水平,根据这个置信水平表找到临界值,并画出检验统计量的接受域和拒绝域。

常见的置信水平有三个,0.9,0.95,0.99,一般都用0.95,我们可以通过查表找到对应自由度(样本量)的临界值,比如我们这个30样本的临界值就是2.042(双侧检验),根据临界值作图

 

 第五步:根据我们计算出来的检验值是落在了拒绝域还是接受域,下结论。

模板:因为我们得到的t* = 3.05505>2.048,因此我们可以下结论:在95%的置信水平上,我们拒绝原假设H0:r = 0,因此r是显著的不为0的。

MATLAB代码(画图):

  • %% 假设检验部分
  • x = -4:0.1:4;
  • y = tpdf(x,28);  %求t分布的概率密度值 28是自由度  
  • figure(1)
  • plot(x,y,'-')
  • grid on  % 在画出的图上加上网格线
  • hold on  % 保留原来的图,以便继续在上面操作
  • % matlab可以求出临界值,函数如下
  • tinv(0.975,28)    %    2.0484
  • % 这个函数是累积密度函数cdf的反函数
  • plot([-2.048,-2.048],[0,tpdf(-2.048,28)],'r-')
  • plot([2.048,2.048],[0,tpdf(2.048,28)],'r-')

执行后图像

除了上面这个方法可以检验person相关系数外还有一种更好用的方法:

p值判断法

我们得到的检验值还是t = 3.05505哈,根据这个值,我们可以计算出对应的那个概率

 标星*** p<0.01, ** p<0.05, * p<0.1

代码只有一行:

  • %% 计算各列之间的相关系数以及p值
  • [R,P] = corrcoef(Test)
  • % 在EXCEL表格中给数据右上角标上显著性符号吧
  • P < 0.01  % 标记3颗星的位置
  • (P < 0.05) .* (P > 0.01)  % 标记2颗星的位置
  • (P < 0.1) .* (P > 0.05) % % 标记1颗星的位置

执行后

R =

    1.0000    0.0665   -0.2177   -0.1920    0.0440    0.0951
    0.0665    1.0000    0.0954    0.0685    0.0279   -0.0161
   -0.2177    0.0954    1.0000    0.2898    0.0248   -0.0749
   -0.1920    0.0685    0.2898    1.0000   -0.0587   -0.0019
    0.0440    0.0279    0.0248   -0.0587    1.0000   -0.0174
    0.0951   -0.0161   -0.0749   -0.0019   -0.0174    1.0000


P =

    1.0000    0.1061    0.0000    0.0000    0.2859    0.0208
    0.1061    1.0000    0.0204    0.0960    0.4978    0.6963
    0.0000    0.0204    1.0000    0.0000    0.5469    0.0687
    0.0000    0.0960    0.0000    1.0000    0.1542    0.9637
    0.2859    0.4978    0.5469    0.1542    1.0000    0.6728
    0.0208    0.6963    0.0687    0.9637    0.6728    1.0000

三颗星最好相关性最高,二星次之,dddd
三颗星的位置:

   0     0     1     1     0     0
   0     0     0     0     0     0
   1     0     0     1     0     0
   1     0     1     0     0     0
   0     0     0     0     0     0
   0     0     0     0     0     0

两颗星的位置:

     0     0     0     0     0     1
     0     0     1     0     0     0
     0     1     0     0     0     0
     0     0     0     0     0     0
     0     0     0     0     0     0
     1     0     0     0     0     0

一颗星的位置:

     0     0     0     0     0     0
     0     0     0     1     0     0
     0     0     0     0     0     1
     0     1     0     0     0     0
     0     0     0     0     0     0
     0     0     1     0     0     0

处理好后的表格 

 貌似还可以用SPSS来算这个表,后面再说吧,要去睡了

以上是关于相关系数之皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数(评价线性关系的相关系数)(第二部分)的主要内容,如果未能解决你的问题,请参考以下文章

相关系数之皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数(评价线性关系的相关系数)(第二部分)

相关系数之皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数(评价线性关系的相关系数)

相关系数之皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数(评价线性关系的相关系数)(第一部分)

相关性Correlations 皮尔逊相关系数(pearson)和斯皮尔曼等级相关系数(spearman)

数学建模:相关性分析学习——皮尔逊(pearson)相关系数与斯皮尔曼(spearman)相关系数

如何理解皮尔逊相关系数