在 ML 分类问题中以高精度预测结果

Posted

技术标签:

【中文标题】在 ML 分类问题中以高精度预测结果【英文标题】:Predicting results with high precision in ML classification problem 【发布时间】:2019-08-02 12:58:49 【问题描述】:

我正在研究一个多类分类问题,并且只想对单个类进行高精度预测(即预测较少但正确)。

我突出显示了第 1 类的预测总数和真阳性病例数。有什么建议,如何调整高精度的模型?

PS:其他类的结果无所谓,我们只关注class-1的精度。请在下面找到结果

【问题讨论】:

【参考方案1】:

这里可能的问题之一可能是类不平衡问题。由于数据集中样本的大小不等,您开发的模型可能偏向于特定类别。为所有类别保持相似的样本量可能会提高您的精度/准确度。希望这会有所帮助

【讨论】:

我已经对训练数据集进行过采样(使用 SMOTE),因为您可以看到训练数据集在所有类中平均分布。

以上是关于在 ML 分类问题中以高精度预测结果的主要内容,如果未能解决你的问题,请参考以下文章

我如何在ML中对评论进行分类?

使用 ML 对纵向数据进行分类预测

ML-10多分类及多标签分类算法

ML(4.3): R Random Forest

如何在 2 列上训练 ML 模型以解决分类问题?

评价-分类算法的评价指标