时间序列分析

Posted 精炼数据研习室

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了时间序列分析相关的知识,希望对你有一定的参考价值。


时间序列分析(二)


在上一次的推文中我们介绍了时间序列分析的思想,现在回顾一下:时间序列分析是通过历史的信息来预测未来。进行预测的前提是序列是平稳的,即序列的基本特性不发生太大的改变。不过如果时间序列是纯随机过程(白噪声),也就是无自相关性,那么预测也无法进行。因此,我们要对平稳的,非随机序列进行分析,从而预测未来。预测的方式通常是建立预测模型。时间序列分析的预测模型主要有以下几种:

 

1.      移动平均预测(Moving Average):将过去期的变量取平均值作为下一期的预测值。根据取平均的方式不同,移动平均又可以分为:

 

1.1    简单移动平均(SimpleMoving Average):简单移动假设平均各元素的权重都相等。计算公式如下:

Ft=(At-1+At-2+At-3+…+At-n)/n


式中,Ft--对下一期的预测值;

n--移动平均的时期个数;

At-1--前期实际值;

At-2,At-3和At-n分别表示前两期、前三期直至前n期的实际值。

 

1.2   加权移动平均(Weighted Moving Average):加权移动平均给固定跨越期限内的每个变量值以不相等的权重。其原理是:历史各期的数据信息对预测未来的作用是不一样的。除了以n为周期的周期性变化外,远离目标期的变量值的影响力相对较低,故应给予较低的权重。

加权移动平均法的计算公式如下:

       Ft=(w1At-1+w2At-2+w3At-3+…+wnAt-n)/u

       式中,w1--第t-1期的权重;

       w2--第t-2期的权重;

       wn--第t-n期的权重;

       n--预测的时期数; 且,w1+ w2+…+ wn=u

在运用加权平均法时,权重的选择是一个应该注意的问题。经验法和试算法是选择权重的最简单的方法。一般而言,最近期的数据最能预示未来的情况,因而权重应大些。

 

1.3   指数加权移动平均(Exponential Moving Average):在时间 t, 根据实际的观测值(或量测值)我们可以求取EWMA(t)如下:


EWMA(t ) = λY(t)+ ( 1-λ) EWMA(t-1) for t = 1, 2, ..., n.


* EWMA(t):t时刻的估计值 
* Y(t): t 时间之量测值﹐
* n :观测值的个数
* λ ( 0 < λ< 1) ,平滑系数,表EWMA对于历史量测值之权重系数﹐其值越接近1,表对过去量测值的权重较低。

 λ 决定了EWMA模型跟踪实际数据突然发生变化的能力,即时效性。随着λ 增大, 模型估计的时效性就越强,反之,时效性越弱。另一方面,由于 λ 的存在,EWMA还表现出一定的吸收瞬时突发的能力,这种能力称为平稳性。显然随着 λ 减小, 模型的平稳性增强,反之降低。


2.   ARMA预测模型:


移动平均中的参数(如选取的过去的期数,权重值,平滑系数等)往往带有极强的主观性。为了更精准的做出预测,我们经常会用到的是自回归模型(Autoregressive Model,AR Model),移动平均模型(Moving Average Model, MA Model),以及两者结合在一起的ARMA Model(Autoregressive Moving Average Model)。

 

2.1 AR模型(Auto Regression Model)又称自回归模型。该模型认为通过时间序列过去时点的线性组合加上随机扰动项(即白噪声)即可预测当前时点。设{y(t),t=0,±1,±2,…}为时间序列,白噪声序列为{ε(t),t=0,±1,±2,…},均值为0,方差为σ,则称满足等式

 

Y(t)=a0+a1*Y(t-1)+a2*y(t-2)+…+ap*y(t-p)+ε(t)


的时间序列为p阶自回归(Autoregression)序列,上式为p阶自回归模型,记作 AR(p)。其中a0,a1, a2,…, ap是自回归参数。可见,此自回归模型描述了数据序列内部的递推的线性回归关系。

 

2.2 MA模型(Moving Average Model):亦称移动平均模型。与前述的移动平均不同,MA模型也加入了扰动项,即t期数值由t期以前p期观测值的随机扰动项经加权平均得到。如果时间序列Yt满足


Y(t)= ε(t)+a1*ε(t-1)+a2*ε(t-2)+…+ap*ε(t-p)

 

则称时间序列Yt为服从q阶移动平均模型,记作MA(q)。其中εt为白噪声。所以,MA(q)是白噪声的线性组合。MA模型和AR大同小异,它并非是历史时序值的线性组合而是历史白噪声的线性组合。与AR最大的不同之处在于,AR模型中历史白噪声的影响是间接影响当前预测值的(通过影响历史时序值)。


2.3 ARMA模型(Auto Regression Moving Average model)即自回归移动平均模型。ARMA模型是对不含季节变动的平稳序列进行建模。它将序列值表示为过去值和过去扰动项的加权和。模型形式如下:



其中Yt为序列值,εt为零均值白噪声序列。相较于AR(p),MA(q),ARMA(p,q)更具有普适性。它的特别形式就是上面介绍的两个模型。AR(p)是q=0时的ARMA(p,q)模型, MA(q)是p=0时的ARMA(p,q)模型。有关ARMA模型的建模实例,我们会在下一次的推送中展示。




以上是关于时间序列分析的主要内容,如果未能解决你的问题,请参考以下文章

(19)时间序列分析

16种常用的数据分析方法-时间序列分析

基于SPSS的时间序列分析(转载自某大神)

时间序列分析概述

如何使用SPSS做时间序列分析

Tableau(一):时间序列分析