为啥时间序列模型比较难学?时间序列的正名路

Posted 计量经济圈

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了为啥时间序列模型比较难学?时间序列的正名路相关的知识,希望对你有一定的参考价值。

欢迎投稿计量经济圈邮箱:

econometrics666@sina.cn

作者知乎专栏(阅读原文,了解更多):

https://zhuanlan.zhihu.com/econometric

为啥时间序列模型比较难学?时间序列的正名路

时间序列模型跟其它计量模型都不一样,这种不一样带给时间序列世人的误解,同时带给经济学学子被时序支配的恐惧。


很大部分原因是,时间序列是一门古老的学科。匠人们采用传统的手艺,遗留着尼罗河平原野蛮而鲁莽的作风,信仰“泛函中心极限”这样少为人知的宗教,问一些“就算改信西医,又能让我多活几年?”这样在中产阶级科学观之下大逆不道的问题。学惯了逻辑回归的人,再看这些没有逻辑的玄学,总会嫌Low,不愿将就。


时间序列自己的问题也是有的,说服力不够强。毕竟,许多技法是在当年数据稀缺、逻辑混乱的时期发展而来的方法,那时候容不得穷讲究,硬生生就让给预测,这叫大法师的亮剑精神。哪怕今天的时间序列分析,很多工作比“天狗食月”模型都要粗糙。


(没记错的话,《经济解释》(张五常)开篇不久就写到,曾经有人用“天狗食月”理论对月食进行过不错的预测,但是,受过波普尔科学观教育的人,又有谁,已经知道月食的真相了,还肯去分析“天狗的睡眠习惯与饮食策略”?但需要知道的是,科学研究当中并不会总这么幸运,总能一开始就知道类似“月食”这种问题的真相,有时就会用到“天狗食月”这种层次的模型。那时,管用的都是这种模型。)


粗糙,不代表没用。



外生解释变量解释不来许多东西。比如记忆。


时间序列,就是用自己的历史研究自己。


暴力找规律,用所有可能想到的办法,把被解释变量在当下的观测值,表示成其历史观测值的函数,有点像做公务员行测数学。VAR把暴力推向了一个顶峰。


灰度预测为例,万一差分序列有规律是等差呢?万一累加序列有规律是等比呢?万一取值就是差分和累加的函数呢?


这里面,通常有一点点经济学背景,或者也可以干脆没有经济学。


通常是先试错,抱着求死的信念,一个接着一个的模型前赴后继赴汤蹈火,就算前面是地雷阵或者万丈深渊也万死不辞。


碰巧就发现一些稳定,但我们不认识的东西。然后,就可以去尝试认识它了。移动平均,交个朋友呗,请在我的工具箱里面凑个数,以后请多关照。


通常从一般里发现特殊,就是人类发现知识的最初模式。


难怪计量学子们接受不来。要知道,在过去学的计量里,那些特殊,那些谁影响谁,生产函数里都写着呢呀!(写的对不对搁在一边,你用的那个生产函数,究竟是经济学逻辑的推导来的,还是从一般里总结出来的?)

科学不能解答一切,因为证伪的规矩太严格;逻辑不能解答一切问题,因为人类想搞清楚的问题永远超出自身思考的能力。


对于科学不能解答,逻辑不能解答的问题,我们不能回避,要去认识,大法师会想到用观察它历史的方式认识它,这是时间序列建模最后的尊严。


何况时间序列发现的许多东西,后来也都被解释了。


甚至还有理论帮助时间序列VAR建模,这种事情发生。


不能不说这是时间序列的一次历史性突破,老者激动地说,就发生在古埃及,尼罗河平原潮汐的时间序列,最终可以跟月相建VAR!比单独建一个AR(360)好使多了!



如果除了记忆,其它我们一无所知,既然有可能有用。


那就把记忆拿过来,来解释一部分被解释变量好了。


记忆是内生的,有时却对研究有所助益,预测个期望什么的。


这种助益未必不高,但通常有限。


有限的有用。


看起来怂,打起来,未必输给其它模型,都是一个山上的狐狸,谁不知道书生撩妹时常说的all models are wrong.


说完了哲学

下面说点干货,就说说平稳性吧。



单独说说平稳性。


人生是平稳的么?其实这个问题就想问问,记忆能用来研究被解释变量么?


不同时期之间的观测值,究竟有多大的共性可循?


共性的存在,意味着,解释被解释变量不能只看解释变量,而不去看看它的历史。


保持稳定的共性,就可以用历史观测值做解释变量,解释当期观测值了。而没有稳定的共性,这几期能这么解释,下一个阶段就不能这么解释了,建模将以失败告终。


至于历史决定了多少,那还真是存疑。以下面这个生成过程为例:

为啥时间序列模型比较难学?时间序列的正名路


你无论怎么回归,R2都过不了0.5.

但是对于这样的数据,识别出自回归模型总还是聊胜于无,因为你别的什么也不知道,但是时期间的相关性几乎是确定的!


评价平稳性的方法有很多,大都粗陋不堪。


1)估计参数,然后解特征方程,求过程的特征根

2)画单位圆,然后打点,跟求特征根十分相似。

3)用自相关性质和偏自相关性质来估摸

4)用图,用谱,用图谱。

5)单位根检验/平稳性检验/记忆性检验


其实人家吧,可能不过是多变了几次结构,十期变个七八次而已,你就说人家不平稳,我抽烟,我纹身,我牵过男人的手,但我要你看看我的心!


受过21世纪计量教育的人,最多信一信检验,有时还会有执念,你究竟是变结构,还是单位根,还是非线性,还是变结构单位根。


没有执念的人,一般交错鉴定一下,初步判断没有过拟合,然后哪个模型好用用哪个,我从一团漆黑当中发现一个或许存在的特殊规律,你敢不敢别这么讲究。皇上就要大法师说句话搪塞,真相这么重要么?要问真相是花钱的,凑合着选个模型用不是比没有强么。


15世纪之前,中医跟西医半斤八两。即便今天在中国当期的医疗条件下,在财政和人民观念的约束下,卫生事业不能没有中医,就像不能没有时间序列。



下面用一首诗结尾

为啥时间序列模型比较难学?时间序列的正名路

随便一个单位的冲击来了,

会永远以一个单位的影响幅度持续下去。

人们叫她是单位根的时间序列

人们说她不平稳。


她是一个敏感内向的时间序列。

喜欢翻旧账,喜欢患得患失,

最常说的一句话是,我们再也回不去了。


QQ空间签名是:

不念过去,不畏将来,期望是零,方差交给时间


青年时

世界变化太快,

时不时的,她会遇到变结构

突变、渐变、暂变,各式各样的变化,

让她显得没心没肺,

DF, ADF, PP, KPSS检验对她失效了

波士顿的Perron教授,南开的晓峒老师

都不能觉察到她的不平稳

甚至觉察不到她的长记忆性。

她有时会忘了自己从何出发,

被社会裹挟

每当想问问自己的内心,

自己也搞不清楚,

要用几层的傅里叶展开,要用几阶的差分滞后项,

才能得到那个稳定自回归的初心。

有时甚至会想,

既然人是一切社会关系的总和,

那我,有心么?


恋爱了

她遇到过一个跟她协整的时间序列,

他们相互之间有了联系,

像是月老的红线,

岁月开始平稳起来,

冲击的影响总能化解

小的突变也总能相互适应,

君当做磐石,妾当做芦苇。

他们不知道,

那条红线,

那个负反馈机制,

那组描述他们相互作用的协整矩阵,

也是会随时间改变的。

谁能为生活不变。

线性的阶段是短暂的,

原来这是一段阈值协整

他们各自也只是阈值自回归。

当过去积攒的某一个方向的能量到一定程度,

或正或负,他们就会向新的机制跃迁

或许这就叫鲤鱼跳龙门吧。


假如只看相识那天的数据,

协整是这样的显著,完美

但越是完美的机制,

就越是这样的脆弱,

依赖天时地利,

而且易碎。


工作了

跟同事们,

不敢交浅言深

但却因为工作,产生了奇妙的化学反应。

她方差大的时候,同事方差也大,

她方差小的时候,同事方差也小

他们各自的方差都具有记忆性,

但是因为方差的协整,

均值组合在一起却常常相对稳定,

尽管大家残差的方向常常并不一致,

但团队的表现,

因为协同持续,而相对稳定。


当老去时,

她回忆自己的一生

有些人与她协整,只是一刻。

有些人与她协整,只是一段时间。

有些人一直试图与她协整,但生活的突变饶得了谁。

这些关系,用小样本检测,准确度是不够的。



随着时间的推移,时间序列数据积攒得越来越多,

世上的事情,也就可以看得越来越明白。

原来三岁时发现的时间序列性质,

到老也没有变过。

她还是那个敏感的,内向的孩子。


作者为天津财经大学数量经济学在读博士研究生葛通。


作者留在最后的话:在知乎我还有一个专栏。我相信学问最有魅力的地方,不是教科书上的历史表述,也不是from paper to paper的日进一分,而是二者曼妙而漫长的中间地带,给人世事洞明恍然大悟的惊喜。


在专栏里,我专门讲述教科书与论文之间的中间地带,用模型,讲自己所经历的事情和所学过的学问。在知乎,有大牛跟我评论讨论,有问题的表述可以随时修改,算是我对自己的一种迭代。知乎专栏:

https://zhuanlan.zhihu.com/econometric

欢迎关注,新年加油。


写在后面:各位圈友,咱们的计量经济圈社群里面资料和计量咨询都很多,希望大家能够积极加入咱们这个大家庭)。之后我们会逐步邀请社群里的圈友再直接建立微信群与圈圈对话,进去之后一定要看“群公告”,不然接收不了群信息。


提议

欢迎各位投稿给计量经济圈,各种文献笔记、计量技巧和最新发现都可以实名在这里发出来,让你在这个圈子积累声誉和将来的合作文章合作机会。



以上是关于为啥时间序列模型比较难学?时间序列的正名路的主要内容,如果未能解决你的问题,请参考以下文章

saradc和sigmadeltaadc哪个更难学?

Cadence 是否真的很难学

个人讣告,与Node何干?为莫名躺枪的Node.js正名

让我们再为C#异步编程Async正名

让我们为C#异步编程Async正名

让我们再为C#异步编程Async正名