如何预测scikit-learn中的时间序列？

Question

Scikit-learn使用基于fit和predict方法的非常方便的方法。我有适合fit和predict格式的时间序列数据。

例如，我有以下Xs：

[[1.0, 2.3, 4.5], [6.7, 2.7, 1.2], ..., [3.2, 4.7, 1.1]]

和相应的ys：

[[1.0], [2.3], ..., [7.7]]

这些数据具有以下含义。存储在ys中的值形成时间序列。 Xs中的值是相应的时间相关的“因子”，已知它们对ys中的值有一些影响（例如：温度，湿度和大气压力）。

现在，当然，我可以使用fit(Xs,ys)。但后来我得到了一个模型，其中ys中的未来值仅取决于因子，并且不依赖于先前的Y值（至少直接），这是模型的限制。我想有一个模型，其中Y_n也依赖于Y_{n-1}和Y_{n-2}等。例如，我可能想使用指数移动平均线作为模型。在scikit-learn中最优雅的方法是什么

添加

正如评论中提到的，我可以通过添加Xs来扩展ys。但这种方式有一些局限性。例如，如果我将y的最后5个值作为5个新列添加到X，则有关ys的时间排序的信息将丢失。例如，X中没有迹象表明第5列中的值跟随第4列中的值，依此类推。作为一个模型，我可能希望对最后五个ys进行线性拟合，并使用找到的线性函数进行预测。但如果我在5列中有5个值，那就不是那么简单了。

增加2

为了使我的问题更加清楚，我想举一个具体的例子。我想有一个“线性”模型，其中y_n = c + k1*x1 + k2*x2 + k3*x3 + k4*EMOV_n，其中EMOV_n只是一个指数移动平均线。怎样，我可以在scikit-learn中实现这个简单的模型吗？

Answer 1

另一答案