时间序列预测初步分析(Preliminary analysis)

Posted 哈希大数据

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了时间序列预测初步分析(Preliminary analysis)相关的知识,希望对你有一定的参考价值。

预测任务的基本步骤

1

定义问题

    定义问题往往是预测任务最困难的部分,因为在定义问题之前我们需要详细了解预测目标并找出与之相关的全部因素另外,预测者往往需要花费大量时间收集数据,建立数据库,并制定计划。

2

收集信息

    收集信息一般包括两方面:一是统计数据,二是收集数据者的专业知识。在很多时候,我们无法收集到足够的历史数据来拟合模型,有时一些老的数据无法使用。

3

初步分析(Preliminary analysis

    清洗数据后,画出 不同时间(按小时、天、周、月、年)的时间序列,观察曲线趋势,判断是否具有周期性、季节性,判断自变量与因变量相关性等。

4

选择模型


    根据数据特征选择/建立预测模型,建立模型往往需要一些假设,模型的参数需要通过数据拟合得到。一般讨论的模型包括:回归模型、指数平滑模型、ARIMA模型、动态回归模型、人工神经网络模型和向量自回归模型等。

5

评估模型的预测精度

    数据一般可划分为:测试集、验证集、预测集,通过测试集数据拟合模型、确定模型参数,通过验证集评估模型预测精度、并修正和改进模型,通过预测集预测目标值。

【时间序列预测】初步分析(Preliminary analysis)


    由于预测问题各不相同,收集的信息差异较大,数据清洗、数据处理是一个非常重要的问题,我们将在之后详细讲解。今天主要讲解第三步,如何对数据进行初步分析?

    建立模型之前,我们需要初步分析时间序列,时间序列分析一般包括:趋势性(trend)、季节性(seasonal)、周期性(cycle)。

  •     趋势性,是指在很长的一段时间内,数据有增加或者减少的趋势:

【时间序列预测】初步分析(Preliminary analysis)

澳大利亚抗糖尿病药品的月销量

  • 季节性,是指数据受到“季节性”的影响,一周中每一天的差别、一年中每个月的差别。如上图中,由于澳大利亚的糖尿病药品在每年的年末会调整,所以药品的月销量有明显的季节性。

  •   周期性,由于商业周期或经济环境的影响,销量数据往往会出现周期性的变化。如何区分季节性和周期性呢?季节性数据具有一个固定的时间长度,而周期性数据的长度是可变的和未知的。周期性数据的周期长度一般比季节性数据的“季节间隔”要长一些,另外,周期变化的幅度通常比季节变化的变化更大。

在很多情况下,时间序列都会包括趋势性、周期性和季节性。我们需要在选择模型之前,分析数据的性质。澳大利亚糖尿病药品销量季节性分析如下:

【时间序列预测】初步分析(Preliminary analysis)


seasonplot(a10,ylab="$ million", xlab="Year",main="Seasonal plot:antidiabetic drug sales",year.labels=TRUE,year.labels.left=TRUE,col=1:20,pch=19)


【时间序列预测】初步分析(Preliminary analysis)


monthplot(a10,ylab="$million",xlab="Month",xaxt="n",main="Seasonal deviation plot: antidiabetic drug sales")

axis(1,at=1:12,labels=month.abb,cex=0.8)


    上图中,横线代表每月的平均销量,上图可以清晰的看到药品销量的季节性及销量变化。在这个例子中,季节变化不是很明显,但在很多时候这个方法可以很好的展示销量随季节的变化情况。

散点图

    在时间序列数据分析过程中,散点图对于分析横向数据(Cross-sectional data)的自变量与因变量关系很有帮助。当同时有多个自变量的情况时,可以通过散点图矩阵(Scatterplot matrices)来分析变量之间的关系。下图是不同汽车的二氧化碳排放量问题的自变量的散点矩阵:

    散点图矩阵的横坐标和纵坐标为各个自变量,通过散点图矩阵可以快速、清晰的分析自变量两两之间的关系。

    除此之外,通过数值分析(Numerical data summaries)也能获得数据的一些信息,例如:单变量统计,双变量统计,自相关和白噪声等。

    在数据初步分析之后,根据数据特点建立预测模型,并进行模型测试,调整模型参数,提高模型预测精度,我们将在之后为大家介绍。




以上是关于时间序列预测初步分析(Preliminary analysis)的主要内容,如果未能解决你的问题,请参考以下文章

01背包方案数(变种题)Stone game--The Preliminary Contest for ICPC Asia Shanghai 2019

条件随机场介绍—— An Introduction to Conditional Random Fields

时间序列分析

The Preliminary Contest for ICPC Asia Xuzhou 2019

数据挖掘实战——应用系统负载分析与容量预测(ARIMA模型)

数论初步