pipeline结合GridSearchCV的一点小介绍

Posted null

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pipeline结合GridSearchCV的一点小介绍相关的知识,希望对你有一定的参考价值。

 1     clf = tree.DecisionTreeClassifier()
 2 
 3     ‘‘‘
 4  5     GridSearchCV search the best params
 6     ‘‘‘
 7     pipeline = Pipeline([(tree, clf), ("svm", svm)])
 8    
 9    
10     11     param_test = dict(tree__min_samples_leaf=range(5, 16, 2), tree__criterion=["gini","entropy"],svm__C=[0.1, 1, 10])
12     gsearch2 = GridSearchCV(pipeline,param_grid=param_test, scoring="accuracy", n_jobs=2, cv=5)
13     gsearch2.fit(np.array(x_train), np.array(y_train))
14     print(gsearch2.best_estimator_)
pipeline 联合estimator,使其使用一个fit,简化代码。

命名规则:
pipeline = Pipeline([(‘tree‘, clf), ("svm", svm)])
param_test = dict(tree__min_samples_leaf=range(5, 16, 2), tree__criterion=["gini","entropy"],svm__C=[0.1, 1, 10])

tree‘(自己设定的名称)通过“__”连接estimator的参数(min_samples_leaf),range代表取值范围。

例如,min_samples_leaf为决策树里面的一个参数设置,tree.DecisionTreeClassifier(min_samples_leaf=?)

pipeline的流程在次不做介绍。


 

以上是关于pipeline结合GridSearchCV的一点小介绍的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 Pipeline 和 GridSearchCV 找到线性回归问题的系数

Scikit-learn 多输出分类器使用:GridSearchCV、Pipeline、OneVsRestClassifier、SGDClassifier

Pipeline 和 GridSearchCV,以及 XGBoost 和 RandomForest 的多类挑战

使用 scikit-learn Pipeline 和 GridSearchCV 时出错

Scikit Learn GridSearchCV 和 pipeline 使用不同的方法

如何使用 GridSearchCV 在嵌套管道中测试预处理组合?