使用预定义的拆分重新调整网格搜索的属性?
Posted
技术标签:
【中文标题】使用预定义的拆分重新调整网格搜索的属性?【英文标题】:Refit attribute of Grid Search with Pre defined split? 【发布时间】:2019-11-25 07:03:09 【问题描述】:我正在使用 GridseachCV 来调整超参数。我分别有火车,验证数据。我正在按照预定义的拆分方法来处理这个问题(类似于this):
ps = PredefinedSplit(test_fold=your_test_fold)
然后在GridSearchCV
中设置cv=ps
如果我将 refit 参数设置为 true,在所有参数调整之后,我的模型是在整个数据上训练还是只在训练数据上训练?
【问题讨论】:
【参考方案1】:来自the documentation:
refit : boolean, string, or callable, default=True
使用在整个数据集上找到的最佳参数重新调整估计器。
因此,是的,它将使用具有最佳超参数的整个数据集。无论您使用默认(3 折 CV)还是来自 PredefinedSplit
的拆分都没有关系。
【讨论】:
以上是关于使用预定义的拆分重新调整网格搜索的属性?的主要内容,如果未能解决你的问题,请参考以下文章
如果我在 python 管道中有自定义的集成模型,如何进行交叉验证和网格搜索