如何确定分类模型中的阈值?

Posted

技术标签:

【中文标题】如何确定分类模型中的阈值?【英文标题】:How to decide threshold in classification model? 【发布时间】:2017-05-30 21:23:39 【问题描述】:

假设我建立了一个分类模型,然后为了提​​高精度,比如说,我只是增加了更高类别的阈值概率。这有意义吗?我没有改变模型,只是改变阈值概率以获得更好的答案。可以吗?谢谢

【问题讨论】:

我没关系! 【参考方案1】:

这是完全可以接受的,事实上这也是我们有 ROC 曲线和精确召回曲线的原因之一。

更改阈值称为参数调整,是一种常见做法。

【讨论】:

【参考方案2】:

参数调整,例如根据您的数据设置阈值,非常好。

但是,请记住,您应该对数据进行训练测试拆分。训练数据用于计算你的参数,测试数据应该只在最后使用一次,当你想计算你的算法的执行情况时。如果您需要两个数据集来计算参数(例如,一些参数和另一个用于阈值的数据集),然后再次拆分您的训练数据集(现在您有了训练数据、验证数据和测试数据)。

【讨论】:

以上是关于如何确定分类模型中的阈值?的主要内容,如果未能解决你的问题,请参考以下文章

更改随机森林分类器的阈值

机器学习术语表

不平衡二元分类问题的最佳阈值

AI - 12分类 (Classification)

如何更改二元分类的阈值

分类--阈值