多类语义分割模型评估

Posted

技术标签:

【中文标题】多类语义分割模型评估【英文标题】:Multiclass semantic segmentation model evaluation 【发布时间】:2020-10-09 04:24:01 【问题描述】:

我正在做一个关于多类语义分割的项目。我制定了一个模型,通过降低损失值来输出漂亮的下降分割图像。但是,我无法在诸如 meanIoU 或 Dice 系数之类的指标中评估模型性能。 在二元语义分割的情况下,很容易将阈值设置为 0.5,将输出分类为对象或背景,但在多类语义分割的情况下不起作用。您能否告诉我如何在上述指标上获得模型性能?任何帮助将不胜感激!

顺便说一句,我正在使用 PyTorch 框架和 CamVid 数据集。

【问题讨论】:

【参考方案1】:

如果有人对此答案感兴趣,也请查看this issue。该问题的作者指出,mIoU 可以以不同的方式计算(并且该方法在文献中更被接受)。因此,在将实现用于任何正式发布之前,请考虑这一点。很遗憾,我目前无法使用这些详细信息更新此答案,但将来可能会这样做。

原答案:

下面给出的是 PyTorch 中平均 IoU(联合交集)的实现。

def mIOU(label, pred, num_classes=19):
    pred = F.softmax(pred, dim=1)              
    pred = torch.argmax(pred, dim=1).squeeze(1)
    iou_list = list()
    present_iou_list = list()

    pred = pred.view(-1)
    label = label.view(-1)
    # Note: Following for loop goes from 0 to (num_classes-1)
    # and ignore_index is num_classes, thus ignore_index is
    # not considered in computation of IoU.
    for sem_class in range(num_classes):
        pred_inds = (pred == sem_class)
        target_inds = (label == sem_class)
        if target_inds.long().sum().item() == 0:
            iou_now = float('nan')
        else: 
            intersection_now = (pred_inds[target_inds]).long().sum().item()
            union_now = pred_inds.long().sum().item() + target_inds.long().sum().item() - intersection_now
            iou_now = float(intersection_now) / float(union_now)
            present_iou_list.append(iou_now)
        iou_list.append(iou_now)
    return np.mean(present_iou_list)

您的模型的预测将采用 one-hot 形式,因此首先使用 softmax(如果您的模型还没有),然后使用 argmax 以获取每个像素处概率最高的索引。然后,我们计算每个类的 IoU(并在最后取平均值)。

我们可以将预测和标签重塑为一维向量(我读到它使计算更快)。对于每个类,我们首先使用pred_inds = (pred == sem_class)target_inds = (label == sem_class) 识别该类的索引。生成的pred_indstarget_inds 将在标记为该特定类的像素处具有 1,而对于任何其他类,则为 0。

那么,目标可能根本不包含该特定类。这将使该类的 IoU 计算无效,因为它不存在于目标中。因此,您为此类类分配了一个 NaN IoU(以便您稍后可以识别它们),并且不让它们参与均值的计算。

如果目标中存在特定类,则pred_inds[target_inds] 将给出一个由 1 和 0 组成的向量,其中 1 的索引是预测和目标相等的那些,否则为零。取所有元素的总和将得到交集。

如果我们将pred_indstarget_inds 的所有元素相加,我们将得到该特定类的并集+ 交集。所以,我们减去已经计算的交集得到并集。然后,我们可以划分交集和并集,得到该特定类的 IoU,并将其添加到有效 IoU 列表中。

最后,你取整个列表的平均值来获得 mIoU。如果你想要骰子系数,你可以用类似的方式计算它。

【讨论】:

以上是关于多类语义分割模型评估的主要内容,如果未能解决你的问题,请参考以下文章

为啥训练多类语义分割的unet模型中的分类交叉熵损失函数非常高?

多类语义分割 - 输出激活?

OpenMMLab AI实战营打卡笔记——06 语义分割算法基础

如何使用keras评估多类分类的结果?

tensorflow 评估和预测的不同结果(F1-Score)

语义分割:如何评估噪声对医学图像分割的有效性和鲁棒性的影响?