如何确定分类模型中的阈值?
Posted
技术标签:
【中文标题】如何确定分类模型中的阈值?【英文标题】:How to decide threshold in classification model? 【发布时间】:2017-05-30 21:23:39 【问题描述】:假设我建立了一个分类模型,然后为了提高精度,比如说,我只是增加了更高类别的阈值概率。这有意义吗?我没有改变模型,只是改变阈值概率以获得更好的答案。可以吗?谢谢
【问题讨论】:
我没关系! 【参考方案1】:这是完全可以接受的,事实上这也是我们有 ROC 曲线和精确召回曲线的原因之一。
更改阈值称为参数调整,是一种常见做法。
【讨论】:
【参考方案2】:参数调整,例如根据您的数据设置阈值,非常好。
但是,请记住,您应该对数据进行训练测试拆分。训练数据用于计算你的参数,测试数据应该只在最后使用一次,当你想计算你的算法的执行情况时。如果您需要两个数据集来计算参数(例如,一些参数和另一个用于阈值的数据集),然后再次拆分您的训练数据集(现在您有了训练数据、验证数据和测试数据)。
【讨论】:
以上是关于如何确定分类模型中的阈值?的主要内容,如果未能解决你的问题,请参考以下文章