概率统计笔记: 协方差与相关系数

Posted UQI-LIUWJ

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了概率统计笔记: 协方差与相关系数相关的知识,希望对你有一定的参考价值。

1 协方差

1.1 定义

假设两个随机变量X和Y满足未知的概率分布,那么X和Y的协方差为:

其中E是求解数学期望的运算符,μx,μy分别是X和Y的均值

1.2 存在的问题

        协方差告诉我们两个随机变量是如何一起移动的,但只用协方差衡量变量相关性存在一些问题:协方差是有量纲的,它的大小受随机变量本身取值范围的影响

2 相关系数

        人们希望使用某个和协方差有关,但是又是无量纲的测量来描述两个随机变量的相关性。

        最简单的做法就是用变量自身的波动对协方差进行标准化,相关系数便由此得来。

2.1 相关系数的定义

        令ρ表示X和Y的相关系数,它的定义为

        其中σx和σy分别是X和Y的标准差

        通过使用X和Y的标准差对它们的协方差归一化,ρ的取值范围为 [-1, +1]: 

2.2 相关系数和XY分布之间的关系

  • ρ(X,Y)=1表示X和Y之间存在确切的线性正相关;

  • ρ(X,Y)=0表示X和Y之间不存在任何线性相关性;

  • ρ(X,Y)=-1表示X和Y之间存在确切的线性负相关。

        值得一提的是,相关系数仅仅刻画 X和Y之间的线性相关性;它不描述它们之间的(任何)非线性关系。

3 时间序列的自相关系数

3.1 时间序列的弱平稳性

算法笔记:ARIMA_UQI-LIUWJ的博客-CSDN博客 提及了弱平稳性

我们这里涉及的弱平稳性性质是:如果时间序列数据具有弱平稳性,那么对于所有的时刻t和任意的间隔k,值之间的协方差,其中γk与时间t无关。他仅仅依赖于时间间隔k。

(比如样本是 ,那么)

3.2 自相关系数ACF

的自相关系数称为的间隔为k的自相关系数。

 当k=0的时候,有:

说明对任何时刻t, 的间隔为k的自相关系数恒为1 

 进一步,我们计算

 

【弱平稳性的性质,时间序列的期望不变】

这里的,

 所以 

【注:也有很多版本底下除的是n,就不太明白究竟应该是哪个。。。但如果n很大h很小的时候,差距并不是很大】

3.2.1 自相关图解读

下面为一些时间序列的自相关图。它们呈现出完全不同结构的自相关性。

 

这个自相关图的时间序列存在明显的趋势

这个相关图的时间序列存在明显的周期性。

 

 这个则同时有一定的趋势和周期性

以上是关于概率统计笔记: 协方差与相关系数的主要内容,如果未能解决你的问题,请参考以下文章

概率统计:数学期望,方差,协方差,相关系数,矩

[概率论与数理统计]笔记:3.4 随机向量的数字特征

概率论与数理统计基本概念随机变量的数字特征

概率论与数理统计 Chapter3. 随机变量的数字特征

概率统计笔记:白噪声与随机游走

机器学习之概率与统计- 多元随机变量及其分布