时间序列分析:时间序列基本概念
Posted SAS知识
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了时间序列分析:时间序列基本概念相关的知识,希望对你有一定的参考价值。
本系列文章将讨论如何建立、识别、拟合和检验时间序列模型,并结合SAS软件中的TIMESERIES过程、ARIMA过程、FORECAST过程、AUTOREG过程及ESM过程介绍如何对平稳时间序列和非平稳时间序列进行建模和预测。
在经济学、工程学、自然科学(特别是地球物理学和气象学)和社会科学等领域,被研究的对象在其发展过程中,由于受到各种偶然因素的影响,往往表现出某种随机性,它们常常被记录成一系列随时间而变化的数据序列。我们把按时间顺序生成的、等时间间隔的这种数据序列称为时间序列。
很多数据都是以时间序列的形式出现的,比如:某种产品的月度需求量、公路事故的周度数量、某化工过程每小时的产出量,等等。时间序列的一个本质特征就是相邻观测值之间具有相互依赖性,这种依赖特征具有很大的实用价值。时间序列分析就是对这种依赖性进行分析的技术。
后面我们会在系列文章中将讨论如何建立、识别、拟合和检验时间序列模型,并结合SAS软件中的TIMESERIES过程、ARIMA过程、FORECAST过程、AUTOREG过程及ESM过程介绍如何对平稳时间序列和非平稳时间序列进行建模和预测。
为了便于后面具体时间序列分析方法的介绍,本节中先介绍基本概念。
了解时间序列
如果一个时间序列中的时间是连续的,那么该时间序列就是连续的。如果时间是离散的,那么该时间序列就是离散的。因此,一个离散时间序列在时刻得到的观测值就可以记为。在本章中,仅仅考虑离散的时间序列。请注意,时间序列中的观测值是按照固定的时间间隔取得的,时间间隔可以是秒、分钟、小时、天等。
如果一个时间序列的取值取决于某些数学函数,如,则称该时间序列是确定性的。如果一个时间序列的未来值只能用概率分布的形式来描述,则表示该时间序列不具有确定性,称为统计时间序列。时间序列图,也称为时序图,就是一个二维坐标图,横坐标表示时间,纵坐标表示序列取值。时序图可以直观地帮助我们了解时间序列的一些基本分布特征。比如,图17.1就是一个时序图,该图展示了从1990年1月到2013年12月美国国内航线旅客数量(源数据可以从http://www.transtats.bts.gov网站上下载得到),每个圆圈代表着一个观测值。尽管在这个序列中有明确的上下波动形状,但是要想准确地预测下一个时段的值仍然是不可能的。这就是本章所关注的统计时间序列。
图17.1从1990年1月至2013年12月美国国内航线旅客数量
如果要考察美国国内航线的旅客数量,很明显是要考虑时间t的,所以可以把旅客数量表示为Y(t)。对每一个确定的时间Y(t0),都是一个随机变量。理论上t的取值范围是(-∞, +∞)为无穷多个依赖于时间t的随机变量,我们称之为随机过程。
对随机过程Y(t)的值进行一次观测和记录,就可以得到在本章开始时所提到的一系列随时间而变化的数据序列,实际上该序列已经是一个确定(而非随机的)常规意义的函数Y(t),我们称之为随机过程的Y(t)一个现实。当随机过程Y(t)的现实的时间参数为离散的,并且时间取值的间隔相等时,那么该现实就是一个时间序列在美国国内航线旅客数量的示例中,如果我们仅仅关心时间t为月份的情况,我们所记录到Y(t)的在1990年1月到2013年12月的一系列值,就是一个表示美国国内航线每个月份旅客数量的时间序列。
时间序列分析的目的是选择恰当的技术和方法,建立合适的随机过程模型,由时间序列的当前值和过去值对未来值进行预测,并解释和描述外部因素和异常干扰对于时间序列的影响,进而通过设计有效的控制方法对时间序列进行控制。
时间序列的数字特征
时间序列分析方法是根据时间序列观测间的依赖性特点,来建立模型,所以对该依赖性特征的识别很重要。用图形的方法可以在一定程度上识别时间序列的特征,且很直观。来看几组时序图,如图17.2至图17.4所示。
图17.2时间序列1-因特尔公司股票月度成交量
图17.3时间序列2-国内天然原油月度产量
图17.4时间序列3-北京月度平均气温
在这些图形中:
时间序列1:该时间序列变化平稳,无明显的周期特征,无明显的趋势;
时间序列2:该时间序列有明显的增长趋势;
时间序列3:该时间序列变化平稳,但有明显的周期特征。
但是图形识别不是量化的标准,所以往往不够准确。
时间序列的数字特征是时间序列的重要统计特征,也是量化识别时间序列的重要依据。
满足以下条件的时间序列称为平稳时间序列
换句话说,平稳时间序列的均值是常数,方差也是常数,序列没有明显的变化趋势,观测值始终围绕在同一个水平线上下波动。图17.2符合平稳时间序列的特征,图17.3是非平稳时间序列。
满足以下条件的时间序列称为白噪声序列,也称为纯随机序列:
从定义来看,白噪声序列是平稳时间序列中的特例。由于白噪声序列不同时刻的取值相互独立(从自相关函数判断),因此从已知的观测值不能对未来进行推断和预测,所以白噪声序列不能用来建立模型。图17.5是一个白噪声序列的时序图。
图17.5白噪声序列
平稳时间序列和白噪声序列在后面的讨论中将经常出现。
在实际应用中,由于信息的缺乏,我们往往不可能知道时间序列理论均值和自相关函数,但是通过样本,是可以计算样本的均值和样本的自相关函数的。
样本自相关函数可以作为时间序列自相关函数的一个估计。
本文结束,下一篇文章介绍常见平稳和非平稳模型。
回复【数据和代码】可以下载《深入解析SAS》一书的数据和代码。
查询往期文章,请回复下列关键字:
【安全】==>【SAS智能平台安全管理】系列文章
【Base基础】==>【Base SAS基础】系列文章
【编程概念】==>【SAS编程基本概念】系列文章
【描述性统计】==>【SAS统计分析系列:描述性统计分析】系列文章
【读外部数据】==>【读取外部数据到SAS数据集】系列文章
【假设检验】==>【参数估计与假设检验】系列文章
【单数据集处理】==>【单数据集处理】系列文章
【方差分析】==>【方差分析】系列文章
【主成分与因子分析】==>【主成分分析与因子分析】系列文章
【多数据集处理】==>【多数据集处理】系列文章
【线性回归】==>【线性回归】系列文章
【数据汇总展现】==>【数据汇总与展现】系列文章
小贴士
读者可以从以下链接获取SAS公司提供的免费版环境:
SAS大学版(SAS® University Edition)是SAS为在校大学生免费提供的基于虚拟机和网页的SAS环境。回复关键字【大学版】,可以查看详细介绍。
下载路径:
https://www.sas.com/en_us/software/university-edition/download-software.html
SAS学术版(SAS® OnDemand for Academics)是 SAS 为学术届人士免费提供的、在线的、基于SAS 私有云上的应用服务环境。
用户首先需要注册,然后按照提示信息就可登录。
注册路径:
http://odamid.oda.sas.com
本文转自《深入解析SAS — 数据处理、分析优化与商业应用 》
如若转载本文,请在文章顶部标注 “本文转自SAS知识 (ID: SASAdvisor),摘自《深入解析SAS — 数据处理、分析优化与商业应用 》”
作者介绍
夏坤庄
《深入解析SAS — 数据处理、分析优化与商业应用》第一作者, SAS软件研究开发(北京)有限公司客户职能部总监。在承担研发工作的同时,夏及其团队负责对SAS非英语市场提供技术支持,并且与在美国及其它地区的团队一起,服务于SAS的SaaS/RaaS业务,同时提供和验证关于SAS产品和技术在应用领域的最佳实践。在加入SAS软件研究开发(北京)有限公司之前,夏就职于SAS中国公司,历任资深咨询顾问、项目经理、首席顾问、咨询经理,拥有丰富的咨询和项目实施经验。在长期的从业经历中,不但为SAS的金融行业客户成功实施了众多深受好评的项目,而且在近年领导实施了非金融行业的多个大数据分析项目。
SAS知识 微信:SASAdvisor 长按二维码关注
欢迎大家投稿,一起分享SAS的点滴
投稿邮箱: sasadvisor@outlook.com
以上是关于时间序列分析:时间序列基本概念的主要内容,如果未能解决你的问题,请参考以下文章