如何使用梯度提升回归预测多输出?

Posted

技术标签:

【中文标题】如何使用梯度提升回归预测多输出?【英文标题】:How to predict multi outputs using gradient boosting regression? 【发布时间】:2020-01-26 12:34:19 【问题描述】:

我已经为gradient boosting regression (GBR) 实现了简单的代码来预测one output 并且效果很好,但是当我尝试预测two outputs 时出现如下所示的错误:

ValueError                                Traceback (most recent call last)
<ipython-input-5-bb1f191ee195> in <module>()
      4          
      5 gradient_boosting_regressor = ensemble.GradientBoostingRegressor(**params)
----> 6 gradient_boosting_regressor.fit(train_data,train_targets)
      7 # 'learning_rate': 0.01

D:\Anoconda\lib\site-packages\sklearn\ensemble\gradient_boosting.py in fit(self, X, y, sample_weight, monitor)
    977 
    978         # Check input
--> 979         X, y = check_X_y(X, y, accept_sparse=['csr', 'csc', 'coo'], dtype=DTYPE)
    980         n_samples, self.n_features_ = X.shape
    981         if sample_weight is None:

D:\Anoconda\lib\site-packages\sklearn\utils\validation.py in check_X_y(X, y, accept_sparse, dtype, order, copy, force_all_finite, ensure_2d, allow_nd, multi_output, ensure_min_samples, ensure_min_features, y_numeric, warn_on_dtype, estimator)
    576                         dtype=None)
    577     else:
--> 578         y = column_or_1d(y, warn=True)
    579         _assert_all_finite(y)
    580     if y_numeric and y.dtype.kind == 'O':

D:\Anoconda\lib\site-packages\sklearn\utils\validation.py in column_or_1d(y, warn)
    612         return np.ravel(y)
    613 
--> 614     raise ValueError("bad input shape 0".format(shape))
    615 
    616 

ValueError: bad input shape (22, 2)

我可以得到任何帮助或想法来预测 two outputs 使用 GBR 吗?

我的尝试如下:

Data_ini = pd.read_excel('Data - 2output -Ra-in - angle.xlsx').iloc[:,:]  
Data_ini_val = pd.read_excel('val - Ra-in -angle 12.xlsx').iloc[:,:] 
train_data = Data_ini.iloc[:,:4] 
train_targets =  Data_ini.iloc[:,-2:]
val_data = Data_ini_val.iloc[:,:4] 
val_targets = Data_ini_val.iloc[:,-2:] 
params = 'n_estimators': 5000, 'max_depth': 4, 'min_samples_split': 2, 'min_samples_leaf': 2
         
gradient_boosting_regressor = ensemble.GradientBoostingRegressor(**params)
gradient_boosting_regressor.fit(train_data,train_targets)

【问题讨论】:

【参考方案1】:

为此使用MultiOutputRegressor

多目标回归

此策略包括为每个目标拟合一个回归器。这是一个 扩展本身不支持的回归器的简单策略 多目标回归。

示例:

from sklearn.multioutput import MultiOutputRegressor

...

params = 'n_estimators': 5000, 'max_depth': 4, 'min_samples_split': 2, 'min_samples_leaf': 2
         

estimator = MultiOutputRegressor(ensemble.GradientBoostingRegressor(**params))
estimator.fit(train_data,train_targets)

【讨论】:

以上是关于如何使用梯度提升回归预测多输出?的主要内容,如果未能解决你的问题,请参考以下文章

线性回归有解析解为啥还要用梯度下降

如何阻止梯度提升机过拟合?

GBDT

机器学习基础:线性回归和梯度下降的初学者教程

Matlab基于极端梯度提升XGBoost实现分类预测(Excel可直接替换数据)

具有单一特征的梯度下降中的特征缩放