时间序列 - 《统计学大师之路:乔治·博克斯回忆录》
Posted 遇见数学
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了时间序列 - 《统计学大师之路:乔治·博克斯回忆录》相关的知识,希望对你有一定的参考价值。
所有的模型都是错误的,
但有些是有用的。
- 博克斯–詹金斯模型、博克斯–考克斯变换、博克斯–本肯设计、博克斯–马勒变换、扬–博克斯检验,以及博克斯–皮尔斯检验:所以这些“博克斯”是同一个人吗?是的,他就是乔治·博克斯(George E.P. Box,1919—2013)
下文节选自《统计学大师之路》, 已获出版社授权许可, [遇见数学] 特此表示感谢!
第八章 时间序列
在 20 世纪 60 年代,我开始写作四本书,而它们是与五位好朋友合作进行的。诺曼·德雷珀和我合著了一本关于演化式操作的书,它在 60 年代末出版。①第二本和第三本是分别与格威利姆·詹金斯和刁锦寰合写的。第四本则是我与斯图·亨特和比尔·亨特合著的《实验员的统计学》,它的写作时间也是四本书里最长的。
当我在伦敦大学学院学习统计学时,我记得曾上过一门关于时间序列的课程。它非常理论化,在当时,我也看不出它有多大实用价值。到后来,在 ICI,我主要关注的是实验设计,但那里的市场情报部有个小组在预测月度销量。它包括一个专家小组,其中有的成员知道比如印度市场对于靛蓝染料的需求,有的了解中国市场对于其他某些染料的需求,如此等等。预测通过汇总这些专家的意见而得到。但当我把他们的月度预测与实际销量进行比较时,我不免心生怀疑。预测值与实际值的差被称为预测误差,而对于一个好的预测,其预测误差应该是随机的、无法从历史数据预测得到的。但我发现,市场情报部的预测并不是这样。我重新看了一下数据,发现一个简单移动平均都比“专家”预测要更好。这个发现无疑不会让专家小组的成员感到高兴,但争执终究没有爆发,因为没过多久, 我就离开 ICI,去了普林斯顿。
后来,我再次遇到时间序列预测问题,但这次是在一个很不同的语境中,在所谓的“自动优化”中。我第二次来到美国后不久, 我便被问到大致这样一个问题:对于某个特定生产过程,其收率 y 与温度 x 的关系可用一条二次曲线来拟合。但随着催化剂的性能衰减,这条曲线会发生漂移,并且其走向无法预测。所以最优解是不固定的,而且它的变化不可预测。现在问题是如何自动调整温度, 使之达到最优解的水平。我的思路是,给温度 x 加上一个小振幅的正弦扰动,使得温度不是保持恒定,而是基于一个定点上下波动。所以如果温度不是处在其最优点,一个正弦扰动就会传递给收率。然后你在收率中寻找这个正弦扰动,通过将 y 乘以另一个具有相同振幅和相位的生成的正弦扰动(比方说 z)。然后你把某个时间段内的乘积 yz 加总起来。最后我们这样来设置系统,使得在∑yz 的符号为正时,温度会自动上调,而在∑yz 的符号为负时,温度会自动下调。我很早就被告知,有人在我之前已经想到了这个主意,所以我无意在此声称具有优先权。
我当时觉得,帮助设计这样一类优化器会教会我们很多,所以我尝试获得普林斯顿大学化学工程系的协作,实际制造出一个,但没有获得成功。恰好在那时,在 1959 年,格威利姆·詹金斯在斯坦福大学统计系做访问学者,并且他告诉他的论文导师乔治·巴纳德, 他在那里过得并不开心。然后乔治写信给我(那时我还在普林斯顿),其中特别提到:“格威利姆在时间序列分析方面知识丰富,我会接受他的判断,甚至优先于约翰·图基的。”当我把信拿给约翰看时,他说:“我想我们应该把这家伙弄过来。”就这样,我和格威利姆结识了。不久后,当我去了威斯康星时,格威利姆也过来了(图 8.1)。
图8.1 格威利姆·詹金斯
在威斯康星,我们结识了杰出的化学工程师奥拉夫·霍根,当时他快退休了。他赞同我们制造一种自我优化的温度控制器的主意,并建议我们尽快申请国家自然科学基金会的资助来完成这个项目。他还补充道:“我有两个研究生可以来做这事。他们最近都失恋了,这样的人再合适不过。”(这两位学生分别是肯·科特瑙尔和托尼·弗雷,后来他们及其他一些学生在自己的博士论文研究中使用了这种温度控制器。)①
我们成功地申请到了资助,然后立即展开工作。奥拉夫·霍根已经退休,但在罗格·阿尔特佩特教授的帮助下,工作得以继续。我最初是以决定论的方式思考自动优化问题,但格威利姆在飞行器设计方面的过往经验表明,将系统的动力学特征以及噪音纳入考量至关重要。特别是,系统的动力学可能会导致传递的正弦扰动改变相位,还会让噪音变得“非平稳”。②这最终让我们在利用差分方程 为动力学和噪音建模方面收获良多。工作稳步推进,在经过大约三年时间后,我们终于制造出了这种温度控制器,并使之能正常工作。过了一段时间后,我们意识到自动优化只是反馈控制的一个具体例子。然后我们又注意到,我们所讨论的这种控制是与非平稳时间序列的预测相关联的。③所以如此这般,格威利姆和我开始感兴趣于时间序列的建模和预测。
① K.D. Kotnour, G.E.P. Box, and R.J. Altpeter, “A Discrete Predictor-Controller Appliedto Sinusoidal Perturbation Adaptive Optimization,” Instrument Society of America Transactions, Vol. 5, No. 3, July 1966, pp. 255–262.
② 非平稳意味着,不同于广泛接受的假设,噪音并不是围绕着一个固定的基准稳定变化的。
③ 在我们合著的那本书中,其中所用的一个时间序列实际上得自我们所造的温度控制器。
向上滑动阅览简介及目录
以上是关于时间序列 - 《统计学大师之路:乔治·博克斯回忆录》的主要内容,如果未能解决你的问题,请参考以下文章