是否可以使用不同的数据集作为 AdaBoostRegressor (sklearn) 中的预测输入?
Posted
技术标签:
【中文标题】是否可以使用不同的数据集作为 AdaBoostRegressor (sklearn) 中的预测输入?【英文标题】:Is it possible to use a different data set as input for prediction in AdaBoostRegressor (sklearn)? 【发布时间】:2018-03-04 22:52:48 【问题描述】:我只是机器学习的初学者,我现在正在玩 sklearn。 我从here 的官方网站复制了 AdaBoostRegressor 的示例并添加了以下内容。
X_pred = np.linspace (6, 12, 100)[:, np.newaxis]
y_pred = regr_2.predict(X_1)
由于训练数据集 X 的范围是 0 到 6,我试图对不同的数据集 X_pred 进行预测,范围从 6 到 12。
但是,我发现 y_pred 的值始终为 -1.05382839,这是训练集输出 y 的最后一个值。 我想知道是否可以使用非输入样本数据集作为预测的输入。 有可能这样做吗?如果是,正确的用法是什么?
顺便说一句,附上的图片是输出。 红色和绿色是基于训练集输入 (0-6) 的预测输出,蓝色是 X_pred (6-12) 的输出。
【问题讨论】:
【参考方案1】:简而言之 - 否。这不是回归的意义所在。回归是关于插值,而不是外推。几乎没有一个回归器可以对训练集外部的数据做出任何预测。
【讨论】:
嗨 Lejlot,感谢您的解释。那么如果我想进行外推,我应该寻找什么?以上是关于是否可以使用不同的数据集作为 AdaBoostRegressor (sklearn) 中的预测输入?的主要内容,如果未能解决你的问题,请参考以下文章
dropout是什么?为什么dropout管用?测试集上是否需要使用dropout?说明为什么神经网络中的dropout可以作为正则化?