深度学习中分类任务的损失函数详解

Posted 2022-11-26 Terry_dong

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了深度学习中分类任务的损失函数详解相关的知识，希望对你有一定的参考价值。

1. 多分类任务损失函数：

tf.nn.softmax_cross_entropy_with_logits

tf.nn.sparse_softmax_cross_entropy_with_logits

2. 交叉熵损失函数的原理

3. softmax原理

1. 多分类任务损失函数：

多分类问题一般用softmax作为神经网络的最后一层，然后计算交叉熵损失。

tf.nn.softmax_cross_entropy_with_logits

TensorFlow 中的 tf.nn.softmax_cross_entropy_with_logits函数可以直接计算多分类损失。

tf.nn.softmax_cross_entropy_with_logits(
    labels,
    logits,
    axis=-1,
    name=None
)

输入labels是标签向量，形状为[batch_size, num_classes]，每一行的labels[i]必须符合有效的概率分布。

输入logits是神经网络最后一层的输出，形状与labels相同。注意logits不需要在神经网络最后一层通过softmax函数，因为tf.nn.softmax_cross_entropy_with_logits函数已经把softmax和交叉熵结合在一起了。案例如下：

logits = [[4.0, 2.0, 1.0], [0.0, 5.0, 1.0]]
labels = [[1.0, 0.0, 0.0], [0.0, 0.8, 0.2]]
tf.nn.softmax_cross_entropy_with_logits(labels=labels, logits=logits)

输出是一组包含softmax交叉熵损失的张量。其类型与logits相同，形状与labels相同。

TensorFlow官方文档对于softmax_cross_entropy_with_logits交叉熵损失的函数的解释是：

Measures the probability error in discrete classification tasks in which the classes are mutually exclusive (each entry is in exactly one class). For example, each CIFAR-10 image is labeled with one and only one label: an image can be a dog or a truck, but not both.

此外，还有tf.nn.sparse_softmax_cross_entropy_with_logits，它们的区别仅仅在于labels，softmax_cross_entropy_with_logits是one-hot输入，而sparse_softmax_cross_entropy_with_logits的label是是int型，输入shape为[batch_size]。

tf.nn.sparse_softmax_cross_entropy_with_logits

这个和上面那个损失函数类似，区别在于输入的labels形式不一样，上面的labels需要是one-hot输入，而sparse_softmax_cross_entropy_with_logits的label是int型（labels的 index），输入shape为[batch_size]。

tf.nn.sparse_softmax_cross_entropy_with_logits(
    labels, logits, name=None
)

案例如下：

logits = tf.constant([[2., -5., .5, -.1],
                      [0., 0., 1.9, 1.4],
                      [-100., 100., -100., -100.]])
labels = tf.constant([0, 3, 1])
tf.nn.sparse_softmax_cross_entropy_with_logits(
    labels=labels, logits=logits).numpy()