是否可以使用不同的数据集作为 AdaBoostRegressor (sklearn) 中的预测输入?

Posted

技术标签:

【中文标题】是否可以使用不同的数据集作为 AdaBoostRegressor (sklearn) 中的预测输入?【英文标题】:Is it possible to use a different data set as input for prediction in AdaBoostRegressor (sklearn)? 【发布时间】:2018-03-04 22:52:48 【问题描述】:

我只是机器学习的初学者,我现在正在玩 sklearn。 我从here 的官方网站复制了 AdaBoostRegressor 的示例并添加了以下内容。

X_pred = np.linspace (6, 12, 100)[:, np.newaxis]
y_pred = regr_2.predict(X_1)

由于训练数据集 X 的范围是 0 到 6,我试图对不同的数据集 X_pred 进行预测,范围从 6 到 12。

但是,我发现 y_pred 的值始终为 -1.05382839,这是训练集输出 y 的最后一个值。 我想知道是否可以使用非输入样本数据集作为预测的输入。 有可能这样做吗?如果是,正确的用法是什么?

顺便说一句,附上的图片是输出。 红色和绿色是基于训练集输入 (0-6) 的预测输出,蓝色是 X_pred (6-12) 的输出。

【问题讨论】:

【参考方案1】:

简而言之 - 。这不是回归的意义所在。回归是关于插值,而不是外推。几乎没有一个回归器可以对训练集外部的数据做出任何预测。

【讨论】:

嗨 Lejlot,感谢您的解释。那么如果我想进行外推,我应该寻找什么?

以上是关于是否可以使用不同的数据集作为 AdaBoostRegressor (sklearn) 中的预测输入?的主要内容,如果未能解决你的问题,请参考以下文章

比较.NET程序集(DLL或EXE)是否相同

在 pytorch 中使用我自己的数据集训练简单的 RNN

使用冻结集作为字典键是不是安全?

我可以查询 OLAP 多维数据集的附加信息吗?

GSVA的使用

dropout是什么?为什么dropout管用?测试集上是否需要使用dropout?说明为什么神经网络中的dropout可以作为正则化?