为高精度计算损失函数的权重

Posted

技术标签:

【中文标题】为高精度计算损失函数的权重【英文标题】:Calculating weights for loss function for high precision 【发布时间】:2018-11-26 04:06:28 【问题描述】:

我有一个不平衡的数据集,其中 2 个类的示例数量少,3 个类的示例数量多。是否有计算损失函数权重的标准方法,从而创建一个高精度的系统?

【问题讨论】:

【参考方案1】:

退后一步,让我指出两个可能的方向:

    欠采样和过采样:此过程发生在数据集级别。目标是从代表性不足的类中生成新样本(过采样)。或者减少过度抑制类的样本数量(欠采样)。请参阅以下链接 + 包:imbalanced-learn。

    调整损失函数:该技术应用于分类器的损失函数,确保来自代表性不足的类别的样本对整体损失的贡献更大(相对而言)。请参阅此讨论How does the class_weight parameter in scikit-learn work?

此外,本文对 8 Tactics to Combat Imbalanced Classes in Your Machine Learning Dataset 进行了概述。

【讨论】:

以上是关于为高精度计算损失函数的权重的主要内容,如果未能解决你的问题,请参考以下文章

计算幅度<1且幅度>1时的精度损失

(Jquery)避免数据相加小数点后产生多位数和计算精度损失

捕捉浮点数的精度损失

004_详解计算机各种语言浮点数运算会存在精度损失原因

php 处理高精度计算函数

php高精度计算问题