SVM 方法可以处理一维数据进行预测吗?
Posted
技术标签:
【中文标题】SVM 方法可以处理一维数据进行预测吗?【英文标题】:Can SVM method deal with 1 dimensional data for forecasting? 【发布时间】:2020-09-21 05:56:05 【问题描述】:我正在使用 SVM 来预测一个特定一维数据的未来值。数据包含 54 个月的销售值,其月份索引从 1 到 54。第一个问题是我认为 SVM 可以进行预测,但我不确定。据我所知,SVM 可以进行分类,但回归呢?谁能告诉我为什么 SVM 可以做回归?
在我的问题中,我尝试将 X 设置为月份索引,将 y 设置为每个月的值。我不太确定我是否做得对,因为没有标签(或者我已经厌倦了使用该值的标签)并且功能只是月份索引。
我尝试用from sklearn import svm
拟合它,得到的结果是训练集的准确率为 100%,测试集的准确率为 0。不知道哪里错了。
代码如下:
import pandas as pd
import numpy as np
df = pd.read_csv('11.csv', header=None, names = ['a', 'b', 'c'])
X = df['b'].values.reshape(-1,1)
y = df['c'].values.reshape(-1,1)
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
from sklearn import svm
clf = svm.SVC(C=0.8, kernel='rbf', gamma=20, decision_function_shape='ovr')
clf.fit(X_train, y_train.ravel())
print("training result:",clf.score(X_train, y_train))
print("testing result:",clf.score(X_test,y_test))
数据集看起来像这样 X = [1, 2, 3, 4,...,53, 54] 和 y = [90, 18, 65, 150.... 289],一维数据集。
【问题讨论】:
【参考方案1】:用于回归目的的 SVM 称为 支持向量回归 (SVR),它在 sklearn 模块中可用。
您需要使用带有适当参数的svm.SVR()
而不是svm.SVC()
。是的,一维数据应该没问题。
Here is a more complete example.
【讨论】:
【参考方案2】:是的,您可以使用回归算法进行预测。描述了如何使回归算法适应预测问题的一般方法here。
还要确保正确评估您的预测算法。当您使用train_test_split
时,您会随机洗牌并拆分您的数据。相反,您应该只使用过去的数据来拟合您的算法并根据未来的数据进行评估。
如果您有兴趣,我们正在为这些用例开发一个扩展 scikit-learn 的工具箱。所以使用sktime,你可以简单地写:
import numpy as np
from sktime.datasets import load_airline
from sktime.forecasting.compose import ReducedRegressionForecaster
from sklearn.svm import SVR
from sktime.forecasting.model_selection import temporal_train_test_split
from sktime.performance_metrics.forecasting import smape_loss
y = load_airline() # load 1-dimensional time series
y_train, y_test = temporal_train_test_split(y)
fh = np.arange(1, len(y_test) + 1) # forecasting horizon
regressor = SVR()
forecaster = ReducedRegressionForecaster(regressor, window_length=10)
forecaster.fit(y_train)
y_pred = forecaster.predict(fh)
print(smape_loss(y_test, y_pred))
>>> 0.139046791779424
【讨论】:
以上是关于SVM 方法可以处理一维数据进行预测吗?的主要内容,如果未能解决你的问题,请参考以下文章