是否可以使用不同的数据集作为 AdaBoostRegressor (sklearn) 中的预测输入？

Posted 2023-03-12

技术标签:

【中文标题】是否可以使用不同的数据集作为 AdaBoostRegressor (sklearn) 中的预测输入？【英文标题】：Is it possible to use a different data set as input for prediction in AdaBoostRegressor (sklearn)? 【发布时间】：2018-03-04 22:52:48 【问题描述】：

我只是机器学习的初学者，我现在正在玩 sklearn。我从here 的官方网站复制了 AdaBoostRegressor 的示例并添加了以下内容。

X_pred = np.linspace (6, 12, 100)[:, np.newaxis]
y_pred = regr_2.predict(X_1)

由于训练数据集 X 的范围是 0 到 6，我试图对不同的数据集 X_pred 进行预测，范围从 6 到 12。

但是，我发现 y_pred 的值始终为 -1.05382839，这是训练集输出 y 的最后一个值。我想知道是否可以使用非输入样本数据集作为预测的输入。有可能这样做吗？如果是，正确的用法是什么？

顺便说一句，附上的图片是输出。红色和绿色是基于训练集输入 (0-6) 的预测输出，蓝色是 X_pred (6-12) 的输出。

【问题讨论】：

【参考方案1】：

简而言之 - 否。这不是回归的意义所在。回归是关于插值，而不是外推。几乎没有一个回归器可以对训练集外部的数据做出任何预测。

【讨论】：

嗨 Lejlot，感谢您的解释。那么如果我想进行外推，我应该寻找什么？

以上是关于是否可以使用不同的数据集作为 AdaBoostRegressor (sklearn) 中的预测输入？的主要内容，如果未能解决你的问题，请参考以下文章