如何在多个标签问题中为 tensorflow 模型设置类权重?

Posted

技术标签:

【中文标题】如何在多个标签问题中为 tensorflow 模型设置类权重?【英文标题】:How to set class weights for tensorflow model in multiple labels question? 【发布时间】:2021-08-21 22:45:38 【问题描述】:

我尝试训练一个模型来通过图像预测多个标签。输出是一个包含五个二进制值的列表,例如 [0,0,0,1,1]

我使用 sigmoid 密集层来获取输出,这是我的代码:

inp = tf.keras.layers.Input(shape = (*IMAGE_SIZE, 3), name = 'inp')
x = tfka.ResNet50(weights = 'imagenet', include_top = False)(inp)
x = tf.keras.layers.GlobalAveragePooling2D()(x)
output = tf.keras.layers.Dense(label_dim, activation='sigmoid')(x)
model = tf.keras.models.Model(inputs = [inp], outputs = [output])

现在,我的问题是我的数据集不平衡。并且很难使其平衡,因为每一行都有五个标签。所以,我尝试为每个标签设置不同的类权重,但我不知道该怎么做。

我试试

class_weight = 'label-1': 1:2, 'label-2': 1:5, 'label-3': 1:1, 'label-4': 2:1, 'label-5': 1:10

但它不起作用。

我的目标是为所有类别和标签分配不同的权重。像这样

在第一个标签中,0类的权重为0.5,1的权重为1

在第二个标签中,0类的权重为0.1,1的权重为1

...

更新:

我认为我应该将我的模型分成五个小模型,因为我想要的是最小化每个标签而不是标签列表的损失。所以将其转换为几个单一的二元分类模型是更好的选择。

【问题讨论】:

在 Python 中,m:n 不是一个比率。尝试使用浮点数作为权重,例如 1:2 变为 0.5、1:5 变为 0.2、2:1 变为 2.0,等等。 如果你查看 tensorflow 文档 (tensorflow.org/api_docs/python/tf/keras/Model#fit),你可以看到 .fit() 可以带一个 class_weight 参数。 但是,.fit() 权重是针对类而不是针对标签的。如果我只有一个包含 3 个类的标签,它的工作方式类似于 'A':0.5, 'B':1, 'C':2。但现在我有 5 个标签,每个标签都有两个类。所以。太复杂了。 【参考方案1】:

您在拟合模型时传递每个类的权重。来自 Tensorflow 的 documentation 指定当调用 .fit() 时,您可以传递包含类权重的字典。确保检查该字典的外观,因为它只接受整数(键)和浮点(权重)格式。

【讨论】:

是的,现在我明白了我关于重量设置的错误,但我想知道如何标记它们。比如标签 1 的 0:0.5 和 label2 的 0:2,......我认为拆分我的模型并仅预测一个标签是一种可能的解决方案。但这似乎很耗时,而且重复的工作太多。你能给我一些建议吗? 如果您使用图像作为输入,也许您可​​以尝试使用 ImageDataGenerator 然后使用 .flow_from_dataframe() 以了解每个标签所在的索引。当你说你想知道如何标记它们时,你的意思是如何计算每个标签的权重?@Carlos 是的。我检查了损失函数,我想我应该把我的模型分成几个小模型。简而言之,我希望每个标签的损失最小。但是我的输出结合了所有标签值,因此在计算损失时,其他值可能会影响结果。

以上是关于如何在多个标签问题中为 tensorflow 模型设置类权重?的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 DataSet API 在 Tensorflow 中为 tf.train.SequenceExample 数据创建填充批次?

如何在 MLLIB / ApacheSpark 中为 RandomForrest 模型上的特征分配标签

如何在 TensorFlow 中恢复多个神经网络模型?

设置 TensorBoard 以在 Google Colab 中为 TensorFlow 对象检测模型运行 eval.py 作业

如何通过在 tensorflow 中使用 softmax-output-layer 来并行确定多个标签(在神经网络中)?

如何将 TensorFlow 图(模型)拆分到多个 GPU 上以避免 OOM?