吴恩达-医学图像人工智能专项课程-第一课第一周11节总结
Posted Tina姐
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了吴恩达-医学图像人工智能专项课程-第一课第一周11节总结相关的知识,希望对你有一定的参考价值。
回顾一下医学图像深度学习面临的三个挑战
三个挑战
我们将讨论医学图像训练算法的三个关键挑战:类不平衡挑战、多任务挑战和数据集大小挑战。对于每一个挑战,我们将介绍一到两种应对方法。
- 类别不平衡:可以使用加权的 loss weighted loss, 或者是均衡采样(resampling)
- 多任务: 多标签loss
- 数据集大小: 迁移学习 + 数据增强
在上一次课程中,我们使用加权损失函数来减少类不平衡带来的影响。今天这节课我们通过另一种方式来实现。即通过重采样来实现类平衡
。
通过重采样来实现类平衡
这里的基本思想是重新采样数据集,这样我们就有了相同数量的 normal 和 mass 示例。让我们看看如何实现这一目标。
首先,我们把 normal 和 mass 的例子放在一起。注意 normal 组有六个例子, mass 有两个例子。现在从这些组中,我们将对图像进行重采样,这样正片和负片的采样数相等。
我们可以从 mass 类中抽取一半示例(4个),从 normal 类中抽取一半示例(4个)。请注意,这意味着我们可能无法在重新采样中包括所有 normal 的示例。此外,在我们重新采样的数据集中,我们可能有多个 mass 示例的副本。
对于这个重新采样的数据集,如果我们现在用和以前一样的方法计算损失,我们可以看到即使没有加权,两类对loss的贡献是相等的。
重采样的方法
要使两类的数量相同,有两种办法。
- 对 normal 类进行欠采样
即仅使用 normal 类的部分样本用于训练,并不需要全部样本量 - 对 mass 样本进行过采样
即 mass 类的样本进行重复采样
这些方法都属于重采样方法的范畴,可以用来解决数据不平衡问题。
欢迎继续阅读下一次内容~~
以上是关于吴恩达-医学图像人工智能专项课程-第一课第一周11节总结的主要内容,如果未能解决你的问题,请参考以下文章
吴恩达-医学图像人工智能专项课程-第一课第一周6-10节总结+作业解读