时间序列分析:平稳时间序列分析之参数估计和诊断检验
Posted SAS知识
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了时间序列分析:平稳时间序列分析之参数估计和诊断检验相关的知识,希望对你有一定的参考价值。
一个平稳模型可以用ARMA模型进行模拟,然后对未知的参数使用矩估计、极大似然估计和最小二乘估计进行估计。本文介绍如果利用这三种方法估计一个平稳模型的参数以及诊断检验。
参数估计
前面已经介绍了任何一个平稳模型都可以用ARMA模型来进行逼近,不失一般性,我们把ARMA模型表示成如下形式:
通过上一节的学习,已经知道如何辨识阶数p和q了,接下来,就要根据实际数据来拟合模型中的p+q+2个未知参数
参数是序列均值,通常采用矩估计方法,用样本均值估计总体均值即可得到它的估计值:
这样一来,原来p+q+2个待估参数就减少为p+q+1个了。对p+q+1个未知参数的估计方法有三种:矩估计、极大似然估计和最小二乘估计。
(1)矩估计
运用p+q个样本自相关系数估计总体自相关系数
在低阶ARMA模型场合下,矩估计方法具有计算量小,估计思想简单直观,且不需要假设总体分布等特点。但是这种估计方法中只用到了p+q个样本自相关系数,样本序列中的其他信息都被忽略了,这导致它的估计精度较差,可见,矩估计方法是一种比较粗糙的估计方法,因此它的值常被用作极大似然估计和最小二乘估计迭代计算的初始值。
(2)极大似然估计
在极大似然的准则下,认为样本来自使得该样本出现概率最大的总体。因此,未知参数的极大似然估计就是使得似然函数达到最大的参数值,似然函数为:
使用极大似然估计必须已知总体的分布函数,而在时间序列分析中,序列总体的分布往往是未知的,为了便于计算和分析,通常假设序列服从多元正态分布。
对对数似然函数中的未知参数求偏导数,就可以得到似然方程组。理论上,求解似然方程组即得到未知参数的极大似然估计值。但是,由于都不是参数的显式表达式,因而似然方程组实际上是由p+q+1个超越方程构成的,通常需要经过复杂的迭代算法才能求出未知参数的极大似然估计值。
极大似然估计法充分应用了每一个观测值所提供的信息,因而它的估计精度较高,同时还具有估计的一致性、渐进有效性等优良的统计性质。
(3)最小二乘估计
在ARMA(p,q)模型中,记
未知参数的最小二乘估计值通常也得借助迭代法求出,并且由于充分了序列观测值的信息,因而最小二乘估计的精度也很高。
在实际运用中,最常用的是条件最小二乘估计法,它指定过去未观测到的序列值等于样本序列的均值。
虽然极大似然估计的计算量要大于最小二乘估计,但是,研究表明,极大似然估计要优于最小二乘估计,特别是对样本长度比较小的时间序列。
ARIMA过程中,考虑到计算量等因素,默认的参数估计方法是条件最小二乘估计;但是,通过长期的实践,SAS和很多使用SAS进行预测的专家都推荐使用极大似然估计做为参数估计的方法。
使用ARIMA过程进行参数估计的语法为:
其中,ESTIMATE语句是ARIMA过程中进行参数估计的语句,选项P指定了进行自回归的阶数,选项Q指定了移动平均的阶数,选项ML指定了使用极大似然估计作为参数估计的方法,也可以用METHOD=ML来指定使用极大似然估计法,默认METHOD=CLS,表示使用条件最小二乘估计法。
例17.7: 在例17.6中已经识别出了一组待选模型,下面根据参数使用简约性原则,对待选模型ARMA(1,1)进行参数估计。
示例代码如下:
输出内容如图17.30和图17.31所示。
图17.30 例17.7中ARMA(1,1)模型参数估计报表
在图17.30中,显示的是极大似然估计(也称为最大似然估计)的参数估计和显著性报表。在ARMA(1,1)模型中,均值项记为MU,其估计值为-0.01166,对应着“MA1,1”,对应着“AR1,1”,很明显,参数“MA1,1”和“AR1,1”都是显著不为零的。
图17.31 例17.7中ARMA(1,1)模型信息
当有多组待选模型时,可以在同一ARIMA过程中多次使用ESTIMATE语句进行参数估计。
诊断检验
模型诊断检验过程将通过计算多个诊断统计量来衡量模型的拟合优度和准确度,并对模型的残差序列进行相关性检验和正态性检验。
衡量模型拟合优度的准则一般有两个:
AIC准则:即Akaike’s Information Criterion,是衡量统计模型拟合优良性的一种标准,它是由日本统计学家赤池弘次创立和发展的,又称赤池信息量准则,它建立在熵的概念基础之上,可以权衡所估计模型的复杂度和该模型拟合数据的优良性。AIC准则鼓励数据拟合的优良性,但是也表示应尽量避免出现过度拟合(Overfitting)的情况。
SBC准则:即Schwarz’s Bayesian Information Criterion,和AIC准则类似,但在计算公式上面略有差别。
当有多个待选模型时,应优先考虑AIC值或者SBC值小的模型。这两个准则在很多进行模型拟合的过程步中都会用到。
衡量模型准确度的统计量有:
当序列值有可能为零时,推荐使用SMAPE。MAPE在商业预测和分析中应用得比较多。当有多个待选模型时,可以通过计算MAPE和RMSE等统计量来衡量模型的准确性。
在例17.7中,在参数估计报表后面输出了ARMA(1,1)模型的拟合优度报表,如图17.32所示。
图17.32 例17.7中ARMA(1,1)模型拟合优度报表
接着,又输出了残差序列的诊断检验结果,如图17.33和图17.34所示。残差序列的ACF图、PACF图、IACF图和白噪声序列Y8的对应相关系数图非常类似,并且白噪声概率都大于0.05,表示残差序列值之间不存在依赖关系。残差序列的直方图和Q-Q图也表示残差序列服从正态分布。
图17.33 例17.7中ARMA(1,1)模型残差诊断
图17.34例17.7中ARMA(1,1)模型残差正态诊断
白噪声检验不仅可以用在对原始时间序列的检验中,也可以用在对残差序列的检验中。如果模型已经从序列中提取出了所有的有用信息,那么残差序列应该是一个白噪声序列,否则,说明序列中某种规律性的信息没有被模型表示出来,也就是说,模型是拟合不足的。
本文结束,下一篇文章介绍平稳时间序列分析之预测。
回复【数据和代码】可以下载《深入解析SAS》一书的数据和代码。
查询往期文章,请回复下列关键字:
【安全】==>【SAS智能平台安全管理】系列文章
【Base基础】==>【Base SAS基础】系列文章
【编程概念】==>【SAS编程基本概念】系列文章
【描述性统计】==>【SAS统计分析系列:描述性统计分析】系列文章
【读外部数据】==>【读取外部数据到SAS数据集】系列文章
【假设检验】==>【参数估计与假设检验】系列文章
【单数据集处理】==>【单数据集处理】系列文章
【方差分析】==>【方差分析】系列文章
【主成分与因子分析】==>【主成分分析与因子分析】系列文章
【多数据集处理】==>【多数据集处理】系列文章
【线性回归】==>【线性回归】系列文章
【数据汇总展现】==>【数据汇总与展现】系列文章
【SQL语言】==>【SQL语言】系列文章
【LOGISTIC回归分析】==>【LOGISTIC回归分】系列文章
小贴士
读者可以从以下链接获取SAS公司提供的免费版环境:
SAS大学版(SAS® University Edition)是SAS为在校大学生免费提供的基于虚拟机和网页的SAS环境。回复关键字【大学版】,可以查看详细介绍。
下载路径:
https://www.sas.com/en_us/software/university-edition/download-software.html
SAS学术版(SAS® OnDemand for Academics)是 SAS 为学术届人士免费提供的、在线的、基于SAS 私有云上的应用服务环境。
用户首先需要注册,然后按照提示信息就可登录。
注册路径:
http://odamid.oda.sas.com
本文转自《深入解析SAS — 数据处理、分析优化与商业应用 》
如若转载本文,请在文章顶部标注 “本文转自SAS知识 (ID: SASAdvisor),摘自《深入解析SAS — 数据处理、分析优化与商业应用 》”
作者介绍
夏坤庄
《深入解析SAS — 数据处理、分析优化与商业应用》第一作者, SAS软件研究开发(北京)有限公司客户职能部总监。在承担研发工作的同时,夏及其团队负责对SAS非英语市场提供技术支持,并且与在美国及其它地区的团队一起,服务于SAS的SaaS/RaaS业务,同时提供和验证关于SAS产品和技术在应用领域的最佳实践。在加入SAS软件研究开发(北京)有限公司之前,夏就职于SAS中国公司,历任资深咨询顾问、项目经理、首席顾问、咨询经理,拥有丰富的咨询和项目实施经验。在长期的从业经历中,不但为SAS的金融行业客户成功实施了众多深受好评的项目,而且在近年领导实施了非金融行业的多个大数据分析项目。
SAS知识 微信:SASAdvisor 长按二维码关注
欢迎大家投稿,一起分享SAS的点滴
投稿邮箱: sasadvisor@outlook.com
以上是关于时间序列分析:平稳时间序列分析之参数估计和诊断检验的主要内容,如果未能解决你的问题,请参考以下文章