预测泊松过程

Posted 2023-03-12

技术标签:

【中文标题】预测泊松过程【英文标题】：Predicting a Poisson process 【发布时间】：2012-01-09 22:13:29 【问题描述】：

我想用泊松分布预测道路交通的到达间隔时间。目前，我使用泊松过程生成（合成）到达时间，以便到达间隔时间呈指数分布。

观察过去的数据，我想预测下一个/未来的到达间隔时间。为此，我想实现一个学习算法。

我使用了各种方法，例如贝叶斯预测器（最大后验）和多层神经网络。在这两种方法中，我都使用输入特征（到达间隔时间）一定长度 n 的移动窗口。

在贝叶斯预测器中，我使用到达间隔时间作为二元特征（1->long，0->short 来预测下一个到达间隔时间为 long 或 short ），而对于n-神经元输入层和m-神经元隐藏层（n=13，m=20）的神经网络，我输入n 之前的到达间隔时间并生成未来的估计到达时间（权重阈值由反向传播算法更新）。

贝叶斯方法的问题在于，如果 short 到达间隔时间的数量高于 long 的数量，它会变得有偏差。因此，它永远不会预测 long 空闲期（因为 short 的后验总是保持较大。而在多层神经预测器中，预测精度不够。特别是对于较高的到达间隔时间，预测精度会急剧下降。

我的问题是“随机过程（泊松）无法准确预测吗？还是我的方法不正确？”。任何帮助将不胜感激。

【问题讨论】：

【参考方案1】：

如果它真的遵循泊松分布，您只能预测下一个交通项目将在给定时间间隔到达的概率 - 概率曲线只是归一化积分（即具有泊松分布 1) 的渐近线。为什么要搞乱神经网络/贝叶斯预测器？

【讨论】：

【参考方案2】：

好吧，如果生成过程是齐次 Poisson 过程，那么就没有那么多可预测的了，对吧？有一个速率参数在整个时间内保持不变并且可以简单地估计，但过去，最近的历史应该对到达间隔时间没有影响。您使用的是最近到达的二进制特征，但齐次泊松过程的全部意义在于到达是独立同分布的指数分布，指数分布是无记忆的。

现在，如果齐次假设不正确，您需要更多地考虑细节，答案取决于您希望对该过程使用什么均值度量。看看 Cox 过程（双随机 Poisson 过程，其中平均度量也是一个随机变量）或可能的 Hawkes 过程（其中每次到达都会导致进一步的活动爆发）。

【讨论】：

以上是关于预测泊松过程的主要内容，如果未能解决你的问题，请参考以下文章

随机过程12 - 泊松过程的推广型

随机过程11 - 泊松过程及其解析计算

泊松过程

R语言泊松回归对保险定价建模中的应用：风险敞口作为可能的解释变量