如何从 scikit-learn 中的 TransformedTargetRegressor 管道中的经过训练的估计器访问属性？

Posted 2023-03-12

技术标签:

【中文标题】如何从 scikit-learn 中的 TransformedTargetRegressor 管道中的经过训练的估计器访问属性？【英文标题】：How to access attribute from a trained estimator in TransformedTargetRegressor pipeline in scikit-learn? 【发布时间】：2020-10-14 09:45:09 【问题描述】：

我使用 scikit-Learn 设置了一个小型管道，我将其包裹在 TransforedTargetRegressor 对象中。训练结束后，我想从训练有素的估计器中访问属性（例如feature_importances_）。谁能告诉我这是怎么做到的？

from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler
from sklearn.ensemble import RandomForestRegressor
from sklearn.preprocessing import MinMaxScaler
from sklearn.compose import TransformedTargetRegressor

# setup the pipeline
Pipeline(steps = [('scale', StandardScaler(with_mean=True, with_std=True)),
                  ('estimator', RandomForestRegressor())])

# tranform target variable
model = TransformedTargetRegressor(regressor=pipeline, 
                                   transformer=MinMaxScaler())
           
# fit model
model.fit(X_train, y_train)

我尝试了以下方法：

# try to access the attribute of the fitted estimator
model.get_params()['regressor__estimator'].feature_importances_
model.regressor.named_steps['estimator'].feature_importances_

但这会导致以下NotFittedError：

NotFittedError：此 RandomForestRegressor 实例尚未拟合。在使用此方法之前，使用适当的参数调用“fit”。

【问题讨论】：

【参考方案1】：

当您查看TransformedTargetRegressor 的文档时，它说属性.regressor_（注意结尾的下划线）返回fitted 回归量。因此，您的调用应如下所示：

model.regressor_.named_steps['estimator'].feature_importances_

您之前的调用只是返回了一个不合适的克隆。这就是错误的来源。

【讨论】：

感谢您的提示！您提出的代码 sn-p 返回了“TypeError: 'Pipeline' object is not subscriptable”。但是，根据您的回答，我发现“model.regressor_.named_steps['estimator'].feature_importances_”有效！

以上是关于如何从 scikit-learn 中的 TransformedTargetRegressor 管道中的经过训练的估计器访问属性？的主要内容，如果未能解决你的问题，请参考以下文章