吴恩达-医学图像人工智能专项课程-第一课第一周11节总结

Posted Tina姐

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了吴恩达-医学图像人工智能专项课程-第一课第一周11节总结相关的知识,希望对你有一定的参考价值。

回顾一下医学图像深度学习面临的三个挑战

三个挑战

我们将讨论医学图像训练算法的三个关键挑战:类不平衡挑战、多任务挑战和数据集大小挑战。对于每一个挑战,我们将介绍一到两种应对方法。

  • 类别不平衡:可以使用加权的 loss weighted loss, 或者是均衡采样(resampling)
  • 多任务: 多标签loss
  • 数据集大小: 迁移学习 + 数据增强

在上一次课程中,我们使用加权损失函数来减少类不平衡带来的影响。今天这节课我们通过另一种方式来实现。即通过重采样来实现类平衡

通过重采样来实现类平衡

这里的基本思想是重新采样数据集,这样我们就有了相同数量的 normal 和 mass 示例。让我们看看如何实现这一目标。

首先,我们把 normal 和 mass 的例子放在一起。注意 normal 组有六个例子, mass 有两个例子。现在从这些组中,我们将对图像进行重采样,这样正片和负片的采样数相等。

我们可以从 mass 类中抽取一半示例(4个),从 normal 类中抽取一半示例(4个)。请注意,这意味着我们可能无法在重新采样中包括所有 normal 的示例。此外,在我们重新采样的数据集中,我们可能有多个 mass 示例的副本。

对于这个重新采样的数据集,如果我们现在用和以前一样的方法计算损失,我们可以看到即使没有加权,两类对loss的贡献是相等的。

重采样的方法

要使两类的数量相同,有两种办法。

  • 对 normal 类进行欠采样
    即仅使用 normal 类的部分样本用于训练,并不需要全部样本量
  • 对 mass 样本进行过采样
    即 mass 类的样本进行重复采样

这些方法都属于重采样方法的范畴,可以用来解决数据不平衡问题。

欢迎继续阅读下一次内容~~

以上是关于吴恩达-医学图像人工智能专项课程-第一课第一周11节总结的主要内容,如果未能解决你的问题,请参考以下文章

吴恩达-医学图像人工智能专项课程-第一课第一周19-20节

吴恩达-医学图像人工智能专项课程-第一课第一周4-5节总结

吴恩达-医学图像人工智能专项课程-第一课第一周1-3节

吴恩达-医学图像人工智能专项课程-第一课第一周6-10节总结+作业解读

吴恩达-医学图像人工智能专项课程-第一课第一周13-15节-迁移学习+数据增强

吴恩达-医学图像人工智能专项课程-第一课第一周12-13节 多任挑战总结