预测泊松过程
Posted
技术标签:
【中文标题】预测泊松过程【英文标题】:Predicting a Poisson process 【发布时间】:2012-01-09 22:13:29 【问题描述】:我想用泊松分布预测道路交通的到达间隔时间。目前,我使用泊松过程生成(合成)到达时间,以便到达间隔时间呈指数分布。
观察过去的数据,我想预测下一个/未来的到达间隔时间。为此,我想实现一个学习算法。
我使用了各种方法,例如贝叶斯预测器(最大后验)和多层神经网络。在这两种方法中,我都使用输入特征(到达间隔时间)一定长度 n 的移动窗口。
在贝叶斯预测器中,我使用到达间隔时间作为二元特征(1->long,0->short 来预测下一个到达间隔时间为 long 或 short ),而对于n-神经元输入层和m-神经元隐藏层(n=13,m=20)的神经网络,我输入n 之前的到达间隔时间并生成未来的估计到达时间(权重阈值由反向传播算法更新)。
贝叶斯方法的问题在于,如果 short 到达间隔时间的数量高于 long 的数量,它会变得有偏差。因此,它永远不会预测 long 空闲期(因为 short 的后验总是保持较大。而在多层神经预测器中,预测精度不够。特别是对于较高的到达间隔时间,预测精度会急剧下降。
我的问题是“随机过程(泊松)无法准确预测吗?还是我的方法不正确?”。任何帮助将不胜感激。
【问题讨论】:
【参考方案1】:如果它真的遵循泊松分布,您只能预测下一个交通项目将在给定时间间隔到达的概率 - 概率曲线只是归一化积分(即具有泊松分布 1) 的渐近线。为什么要搞乱神经网络/贝叶斯预测器?
【讨论】:
【参考方案2】:好吧,如果生成过程是齐次 Poisson 过程,那么就没有那么多可预测的了,对吧?有一个速率参数在整个时间内保持不变并且可以简单地估计,但过去,最近的历史应该对到达间隔时间没有影响。您使用的是最近到达的二进制特征,但齐次泊松过程的全部意义在于到达是独立同分布的指数分布,指数分布是无记忆的。
现在,如果齐次假设不正确,您需要更多地考虑细节,答案取决于您希望对该过程使用什么均值度量。看看 Cox 过程(双随机 Poisson 过程,其中平均度量也是一个随机变量)或可能的 Hawkes 过程(其中每次到达都会导致进一步的活动爆发)。
【讨论】:
以上是关于预测泊松过程的主要内容,如果未能解决你的问题,请参考以下文章