如何在 pyspark 中调整 GBTClassifier 的阈值
Posted
技术标签:
【中文标题】如何在 pyspark 中调整 GBTClassifier 的阈值【英文标题】:how can i adjust the threshold in GBTClassifier in pyspark 【发布时间】:2018-12-31 21:35:36 【问题描述】:pyspark中的GBTClassifier模型上似乎没有办法设置阈值。它确实出现在 explainparams() 中,但不在构造函数中或 pyspark 的 set 函数中。 如果是,请告知如何完成,如果不是 - 我如何调整我的模型以更好地预测我在二元分类问题中的类?
【问题讨论】:
我认为在 Spark 2.4+ 版本中,他们为 GBT 添加了阈值设置,但在 Scala 中并不确定 PySpark! spark.apache.org/docs/latest/api/scala/… 【参考方案1】:从 2.4.4 开始,在 pyspark 中没有办法做到这一点:https://spark.apache.org/docs/2.4.4/api/python/pyspark.ml.html?highlight=gbtclassifier#pyspark.ml.classification.GBTClassifier
【讨论】:
以上是关于如何在 pyspark 中调整 GBTClassifier 的阈值的主要内容,如果未能解决你的问题,请参考以下文章
通过 pyspark.ml CrossValidator 调整隐式 pyspark.ml ALS 矩阵分解模型的参数