相关系数r的计算公式是啥?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了相关系数r的计算公式是啥?相关的知识,希望对你有一定的参考价值。

参考技术A
    01

    相关系数定义式为:若Y=a+bX,则有:令E(X) = μ,D(X) = σ,则E(Y) = bμ + a,D(Y) = bσ,E(XY) = E(aX + bX) = aμ + b(σ + μ),Cov(X,Y) = E(XY) − E(X)E(Y) = bσ。

    相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母r表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。相关系数定义式为:若Y=a+bX,则有:令E(X) = μ,D(X) = σ,则E(Y) = bμ + a,D(Y) = bσ,E(XY) = E(aX + bX) = aμ + b(σ + μ),Cov(X,Y) = E(XY) − E(X)E(Y) = bσ。

    相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。需要说明的是,皮尔逊相关系数并不是唯一的相关系数,但是最常见的相关系数。

    依据相关现象之间的不同特征,其统计指标的名称有所不同。如将反映两变量间线性相关关系的统计指标称为相关系数(相关系数的平方称为判定系数);将反映两变量间曲线相关关系的统计指标称为非线性相关系数、非线性判定系数;将反映多元线性相关关系的统计指标称为复相关系数、复判定系数等。

    相关关系是一种非确定性的关系,相关系数是研究变量之间线性相关程度的量。需要指出的是,相关系数有一个明显的缺点,即它接近于1的程度与数据组数n相关,这容易给人一种假象。因为,当n较小时,相关系数的波动较大,对有些样本相关系数的绝对值易接近于1﹔当n较大时,相关系数的绝对值容易偏小。特别是当n=2时,相关系数的绝对值总为1。因此在样本容量n较小时,我们仅凭相关系数较大就判定变量x与y之间有密切的线性关系是不妥当的。

Excel 公式CORREL算出来的相关系数应该是啥相关系数

参考技术A

1、首先找到需要编辑的Excel文档,双击打开,进入编辑界面。

2、然后在编辑区中输入表格数据,选择一个空白单元格(比如:F8单元格)。

3、接着在选中单元格中输入“=CORREL(C8:C12,D8:D12)”函数公式。

4、然后点击键盘上的Enter键,返回编辑区,即可在“F8”单元格中使用CORREL函数返回“C8:C12”和“D8:D12”两个单元格区域中数据集的相关系数。

以上是关于相关系数r的计算公式是啥?的主要内容,如果未能解决你的问题,请参考以下文章

Excel 公式CORREL算出来应该是啥相关系数?

Excel 公式CORREL算出来的相关系数应该是啥相关系数

怎样求相关系数R值,公式是啥,用excel表怎样算

如何计算两变量的相关系数r?

R语言,分别计算pearson和spearman相关系数

回归分析的判定系数等于1是啥原因