使用来自传感器的时间序列预测故障的最佳模型

Posted

技术标签:

【中文标题】使用来自传感器的时间序列预测故障的最佳模型【英文标题】:Best model to predict failure using time series from sensors 【发布时间】:2020-09-20 22:46:19 【问题描述】:

我正在与一家公司合作开发用于预测性维护的机器学习模型的项目。我们拥有的数据是日志文件的集合。在每个日志文件中,我们都有来自传感器(温度、压力、MototSpeed 等)的时间序列和一个记录发生故障的变量。这里的目的是建立一个模型,该模型将使用日志文件作为其输入(时间序列)并预测是否会出现故障。为此,我有一些问题: 1)能够做到这一点的最佳模型是什么? 2)处理不平衡数据的解决方案是什么?事实上,对于某些故障,我们没有足够的数据。 在将时间序列转换为固定长度的子时间序列后,我尝试使用 LSTM 构建 RNN 分类器。如果有故障,目标为 1,否则为 0。与零的数量相比,1 的数量可以忽略不计。结果,模型总是预测为 0。解决办法是什么?

【问题讨论】:

【参考方案1】:

Mohamed,对于这个问题,您实际上可以从传统的 ML 模型(随机森林、lightGBM 或任何类似性质的模型)开始。我建议您专注于您的功能。例如你提到的压力,MototSpeed。看看某个时间窗口倒退。在同一窗口 st.dev 中计算移动平均值、最小值/最大值。要解决这个问题,您需要拥有一组健康的功能。看看 featuretools 包。您可以使用它或了解可以使用时间序列数据创建哪些功能。回到您的问题。

1) 能够做到这一点的最佳模型是什么?如上所述的传统 ML 方法。你也可以使用深度学习模型,但我会先从简单的模型开始。此外,如果您没有大量数据,我可能不会接触 RNN 模型。

2) 处理不平衡数据的解决方案是什么?您可能希望对数据进行过采样或欠采样。对于过采样,请查看 SMOTE 包。

祝你好运

【讨论】:

以上是关于使用来自传感器的时间序列预测故障的最佳模型的主要内容,如果未能解决你的问题,请参考以下文章

LSTM RNN 同时预测多个时间步长和多个特征

《无人驾驶车辆模型预测控制》——路径规划及轨迹跟踪控制

在 R 中使用 Fable 进行时间序列预测;确定混合模型的最佳模型组合

从随机森林模型中提取树的子集进行预测

论文研读《Deep Learning and Its Applications to MachineHealth Monitoring: A Survey》

PySpark 将模型预测与未转换的数据对齐:最佳实践