为高精度计算损失函数的权重
Posted
技术标签:
【中文标题】为高精度计算损失函数的权重【英文标题】:Calculating weights for loss function for high precision 【发布时间】:2018-11-26 04:06:28 【问题描述】:我有一个不平衡的数据集,其中 2 个类的示例数量少,3 个类的示例数量多。是否有计算损失函数权重的标准方法,从而创建一个高精度的系统?
【问题讨论】:
【参考方案1】:退后一步,让我指出两个可能的方向:
欠采样和过采样:此过程发生在数据集级别。目标是从代表性不足的类中生成新样本(过采样)。或者减少过度抑制类的样本数量(欠采样)。请参阅以下链接 + 包:imbalanced-learn。
调整损失函数:该技术应用于分类器的损失函数,确保来自代表性不足的类别的样本对整体损失的贡献更大(相对而言)。请参阅此讨论How does the class_weight parameter in scikit-learn work?
此外,本文对 8 Tactics to Combat Imbalanced Classes in Your Machine Learning Dataset 进行了概述。
【讨论】:
以上是关于为高精度计算损失函数的权重的主要内容,如果未能解决你的问题,请参考以下文章