如何创建预测数据预测区间带

Posted

技术标签:

【中文标题】如何创建预测数据预测区间带【英文标题】:how to create forecast data prediction interval bands 【发布时间】:2013-11-04 16:34:46 【问题描述】:

我有用于创建预测的季节性数据。我执行的步骤是:去季节化数据,找到去季节化点的线性回归,从线性回归中预测几个点,并将季节性添加到预测值以获得预测数据。我的输入非常正弦,所以一切正常。

问题在于,你对未来的预测越多,预测误差就会增加越多。我想在图表上显示,但我不确定如何计算这些错误。我在想像预测数据的预测区间带(不管它们叫什么)。这些频段会随着您对未来的预测进一步增加。

这里有一些图片展示了我正在尝试做的事情: sample bands image1 sample bands image2

我的问题是这些乐队的名字是什么?然后在 Java/Scala 中存在哪些库来计算它们。

我使用包 org.apache.commons.math3.stat.StatUtils.SimpleRegression 进行线性回归。

我查看了置信区间,但这似乎是针对已经存在的数据,而不是针对预测数据。

【问题讨论】:

【参考方案1】:

您要查找的曲线通常称为预测区间或预测带。

我浏览了 StatUtils 包的文档,似乎没有任何支持,尽管我可能很容易忽略它。

我的建议是,切换到 R (http://www.r-project.org) 来做统计工作。我猜 R 具有计算预测带的功能。如果您需要将其绑定到 Java 程序中,只需启动一个单独的进程来执行 R,进行计算,编写一个输出文件,然后在 Java 中解析输出。这有点难看,但编写难看的胶水代码比在 Java 中重新实现 R 函数要容易得多。

【讨论】:

以上是关于如何创建预测数据预测区间带的主要内容,如果未能解决你的问题,请参考以下文章

Logistic 回归的预测和置信区间

高斯过程预测置信区间奇数

R - 对每组数据使用不同的模型进行预测和置信区间

如何近似计算回归方程的预测区间?

绘制重复条目的置信区间和预测区间

R 上泊松回归的预测区间