RandomizedSearchCV 的 best_params 未按预期显示输出

Posted

技术标签:

【中文标题】RandomizedSearchCV 的 best_params 未按预期显示输出【英文标题】:RandomizedSearchCV's best_params does not show output as expected 【发布时间】:2021-07-13 17:21:16 【问题描述】:

我试图改进我的随机森林分类器参数,但在查看其他人的一些示例后,我得到的输出看起来不像我预期的输出。

我正在使用的代码:

train_x, test_x, train_y, test_y = train_test_split(df, avalanche, shuffle=False)

# Create the random forest
rf = RandomForestClassifier()
rf_random = RandomizedSearchCV(estimator=rf, param_distributions=random_grid, n_iter=100, cv=3, verbose=2, random_state=42, n_jobs=-1)

# Train the model
rf_random.fit(train_x, train_y)

print(rf_random.best_params_)

我得到的输出(这只是几行,但它给了我几百行):

Fitting 3 folds for each of 100 candidates, totalling 300 fits
[CV] END bootstrap=True, max_depth=30, max_features=sqrt, min_samples_leaf=1, min_samples_split=5, n_estimators=400; total time=   1.3s
[CV] END bootstrap=True, max_depth=30, max_features=sqrt, min_samples_leaf=1, min_samples_split=5, n_estimators=400; total time=   1.3s
[CV] END bootstrap=True, max_depth=30, max_features=sqrt, min_samples_leaf=1, min_samples_split=5, n_estimators=400; total time=   1.4s
[CV] END bootstrap=False, max_depth=10, max_features=sqrt, min_samples_leaf=2, min_samples_split=5, n_estimators=1200; total time=   3.8

我期待的输出:

'bootstrap': True,
 'max_depth': 70,
 'max_features': 'auto',
 'min_samples_leaf': 4,
 'min_samples_split': 10,
 'n_estimators': 400

来自this 网站。

有谁知道我做错了什么或者我应该改变什么以使输出变成我期望的那样?

【问题讨论】:

【参考方案1】:

由于verbose=2,您获得了该输出。它的值越高,它将打印的文本越多。这些文本提示不是结果。它们只是告诉您搜索当前适合数据的模型。

这对于查看当前搜索进度很有用(有时可能需要几天时间,因此很高兴知道搜索当前处于流程的哪个部分)。如果您不希望出现此文本,请设置verbose=0

您还没有得到预期的结果,因为rf_random 仍在为数据拟合模型。

搜索完成后,使用rf_random.best_params_ 获取所需的输出。

【讨论】:

以上是关于RandomizedSearchCV 的 best_params 未按预期显示输出的主要内容,如果未能解决你的问题,请参考以下文章

如何解决这个由 GridSearch 引起的 best_estimator_ 错误?

如何使用 RandomizedSearchCV 正确实现 StratifiedKFold

如何为 RandomizedSearchCV 使用预定义拆分

RandomizedSearchCV - param_distrubitions 的问题? [关闭]

sklearn:在 RandomizedSearchCV 中使用管道?

我如何知道 RandomizedSearchCV 测试了哪些参数?