具有多个掩码的 U-Net 图像分割

Posted

技术标签:

【中文标题】具有多个掩码的 U-Net 图像分割【英文标题】:U-Net image segmentation with multiple masks 【发布时间】:2018-07-28 08:32:43 【问题描述】:

我基本上有一个图像分割问题,即图像数据集和为每个图像创建的多个掩码,其中每个掩码对应于图像中的单个对象。所有对象都属于同一类型,但对象的数量可能会有所不同。我正在尝试使用这些数据训练 U-Net。

我可以简单地将所有单独的掩码组合成一个新的掩码并将其作为输出输入网络,但我觉得与“单独识别对象”相关的有用信息可能会在组合掩码的过程中丢失.

我是否应该以及有什么方法可以利用这些附加信息?例如,使网络输出可变数量的掩码而不是一个掩码(如果可能的话)。会不会提高网络的性能?

【问题讨论】:

【参考方案1】:

我正在解决与您相同的问题,因此我没有所有答案,但是如果您想拆分掩码,可以对其进行一次性编码

from keras.utils import to_categorical
masks_one_hot = to_categorical(masks, num_classes=numMasks)

这会将包含多个对象的图像分成 5 个类,因此我的输出向量是:

(numChannels, IMG_WIDTH, IMG_HEIGHT, numMasks)

它可能会根据您使用的目标函数来提高性能 - 对于这种情况,我认为分类交叉熵是合适的。

【讨论】:

以上是关于具有多个掩码的 U-Net 图像分割的主要内容,如果未能解决你的问题,请参考以下文章

图像分割中的背景类

U-net 与 FCN 背后的直觉用于语义分割

基于图像轮廓细化分割掩码

Keras深度学习实战(17)——使用U-Net架构进行图像分割

U-Net 语义分割模型在新图像上测试时失败

U-Net图像语义分割实战:训练自己的数据集