使用预定义的拆分重新调整网格搜索的属性?

Posted

技术标签:

【中文标题】使用预定义的拆分重新调整网格搜索的属性?【英文标题】:Refit attribute of Grid Search with Pre defined split? 【发布时间】:2019-11-25 07:03:09 【问题描述】:

我正在使用 GridseachCV 来调整超参数。我分别有火车,验证数据。我正在按照预定义的拆分方法来处理这个问题(类似于this):

ps = PredefinedSplit(test_fold=your_test_fold)

然后在GridSearchCV中设置cv=ps

如果我将 refit 参数设置为 true,在所有参数调整之后,我的模型是在整个数据上训练还是只在训练数据上训练?

【问题讨论】:

【参考方案1】:

来自the documentation:

refit : boolean, string, or callable, default=True

使用在整个数据集上找到的最佳参数重新调整估计器。

因此,是的,它将使用具有最佳超参数的整个数据集。无论您使用默认(3 折 CV)还是来自 PredefinedSplit 的拆分都没有关系。

【讨论】:

以上是关于使用预定义的拆分重新调整网格搜索的属性?的主要内容,如果未能解决你的问题,请参考以下文章

如果我在 python 管道中有自定义的集成模型,如何进行交叉验证和网格搜索

网格存储配置抛出“未捕获的类型错误:无法读取未定义的属性‘缓冲’”

自定义 scikit-learn 酸洗在网格搜索中不起作用

使用预定义的验证集 Sklearn 执行网格搜索

WPF 不需要的网格拆分器行为

自定义尺寸 iPad 拆分视图