sktime ARIMA 无效频率

Posted

技术标签:

【中文标题】sktime ARIMA 无效频率【英文标题】:sktime ARIMA invalid frequency 【发布时间】:2021-05-22 12:40:36 【问题描述】:

我尝试从 sktime 包中拟合 ARIMA 模型。我导入一些数据集并将其转换为熊猫系列。然后我将模型拟合到火车样本上,当我尝试预测错误时。

from sktime.forecasting.base import ForecastingHorizon
from sktime.forecasting.model_selection import temporal_train_test_split
from sktime.forecasting.arima import ARIMA
import numpy as np, pandas as pd

df = pd.read_csv('https://raw.githubusercontent.com/selva86/datasets/master/a10.csv',
                 parse_dates=['date']).set_index('date').T.iloc[0]
p, d, q = 3, 1, 2
y_train, y_test = temporal_train_test_split(df, test_size=24)
model = ARIMA((p, d, q))
results = model.fit(y_train)
fh = ForecastingHorizon(y_test.index, is_relative=False,)

# the error is here !!
y_pred_vals, y_pred_int = results.predict(fh, return_pred_int=True)

错误信息如下:

ValueError: Invalid frequency. Please select a frequency that can be converted to a regular
`pd.PeriodIndex`. For other frequencies, basic arithmetic operation to compute durations
currently do not work reliably.

我在读取数据集时尝试使用.asfreq("M"),但是,该系列中的所有值都变为NaN。 有趣的是,这段代码适用于来自sktime.datasets 的默认load_airline 数据集,但不适用于我来自github 的数据集。

【问题讨论】:

作为参考,从 0.5.3 版开始,TBATS 需要 pd.PeriodIndex 才能工作。但是 Prophet 需要pd.DatetimeIndex 【参考方案1】:

我得到一个不同的错误:ValueError: ``unit`` missing,可能是由于版本不同。无论如何,我会说最好将数据框的索引设置为pd.PeriodIndex 而不是pd.DatetimeIndex。前者我认为更明确(例如,每月系列的时间步长为时期而不是确切日期)并且工作更顺利。所以在阅读了csv之后,

df.index = pd.PeriodIndex(df.index, freq="M")

应该清除错误(在我的版本中是这样;0.5.1):

【讨论】:

设置索引为df.index = pd.PeriodIndex(df.index, freq="M")后遇到如下错误DateParseError: day is out of range for month @student 无法重现该错误。我怀疑这是由于pandas 版本;我正在使用 1.1.0

以上是关于sktime ARIMA 无效频率的主要内容,如果未能解决你的问题,请参考以下文章

如何更改我的自动 arima 功能中的频率

我应该啥时候使用?? (无效合并)vs || (逻辑或)?

Python中的ARIMA模型SARIMA模型和SARIMAX模型对时间序列预测

python 如何实现发出特定频率的声音

所有列名无效

无效日期的“无效日期”? [复制]