第一课第三周7-10节-AI算法这么棒,为什么我们周围的医院没有使用这些系统?
Posted Tina姐
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第一课第三周7-10节-AI算法这么棒,为什么我们周围的医院没有使用这些系统?相关的知识,希望对你有一定的参考价值。
既然您已经了解了医学成像的分类和分割模型,并且您已经在前面构建了您的胸部x射线分类模型,那么您可能会想知道为什么我们周围的医院或诊所没有使用这些系统。
在本课中,您将了解一些挑战和机会,使这些系统成为常规医疗实践的一部分。
泛化能力
在临床应用人工智能算法的主要挑战之一是实现可靠的泛化。由于各种各样的原因,归纳起来很困难。
让我们看一个例子。假设我们根据美国的数据开发了胸部x光模型,我们想把它应用到另一个国家的医院,比如印度。
在印度,病人可能会有x光片,看起来与模型所训练的不一样。举一个非常具体的例子,结核病在印度相当普遍,但在我们在美国训练模式的医院中不太可能如此普遍。
在将该模型应用于印度之前,我们需要测试该模型检测结核病或结核病的能力。
让我们看另一个例子,这次是我们的脑肿瘤分割模型。我们已经能够根据几年来从几个国家收集的数据来衡量模型的性能,但是核磁共振成像技术在全球和时间上都不是标准的。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Zies1NOM-1627814680149)(https://files.mdnice.com/user/15745/45004a30-e66a-4b81-b92d-464717a4b592.png)]
最新的扫描仪比旧的扫描仪有更高的分辨率。在我们将分割模型应用于一家新医院之前,我们需要确保该模型能够推广到医院扫描仪的分辨率。
额外的验证集
为了能够度量一个模型在一个没有见过的总体上的泛化,我们希望能够从新的总体中对一个测试集进行评估。这称为外部验证。
当测试集从与模型训练集相同的分布中提取时,外部验证可以与内部验证进行对比。
如果我们发现我们没有推广到新的人群中,那么我们可以从新人群中获得更多的样本来创建一个小的训练和验证集,然后根据这些新数据对模型进行微调。
我们讨论过的所有这些研究都使用回顾性数据,这意味着他们使用历史标记的数据来训练和测试算法。
然而,要了解人工智能模型在现实世界中的效用,就需要将其应用于现实世界数据或预期数据。
对于一个胸部x光模型,这可能意味着我们应用一个经过训练的模型来解释新病人接受的胸部x光片。
为什么模型的结果在前瞻性数据上看起来会不同?其中一个原因是,对于回顾性数据,通常需要采取一些步骤来处理和清理数据,但在现实世界中,模型必须处理原始数据。
作为一个具体的例子,你训练模型的数据集已经过滤,只包括正面的x光片,x光片是从病人的正面或背面拍摄的。
然而,在现实世界中,从患者侧面拍摄x光片的一小部分也是很常见的。这些被称为横向x射线。
在我们的模型能够应用于现实世界之前,我们要么需要过滤掉这样的胸部x光片,要么调整模型使其工作。
模型对真实患者的影响
另一个需要反映实际应用的人工智能模型的挑战。我们已经看到了一些评估我们构建的模型的方法,包括查看AUROC曲线下的区域或查看dice得分。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aOn5w6h3-1627814680153)(https://files.mdnice.com/user/15745/afcb795d-7be7-4093-89fb-867fe387bb14.png)]
然而,在现实世界中,我们希望能够看到我们的模型对真实患者的影响。具体来说,我们关心的是衡量模型是否最终改善了患者的健康结果。
解决这一挑战的一种方法包括决策曲线分析,它可以帮助量化使用模型指导患者护理的净效益。
另一种方法是观察在随机对照试验中发生了什么,我们比较了使用人工智能算法的患者和未应用人工智能算法的患者的结果。我们将在课程三中了解随机对照试验的设置。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cyF7B9Qr-1627814680154)(https://files.mdnice.com/user/15745/311b745d-34e7-40ef-9312-4ca5be008e3e.png)]
在现实世界中,我们不仅要分析模型的总体效果,而且要分析它对人口亚群的影响。这将包括不同年龄、性别和社会经济地位的患者。
这使我们能够找到关键的算法盲点或意外偏差。例如,皮肤癌分类可以达到与皮肤科医生相媲美的表现水平,当用于浅肤色患者时,先前在深色肤色的图像上表现不佳。
算法偏差是一个重要而开放的研究领域。在关于医学预后的第二课中,我们将介绍一个场景,在这个场景中,像误用缺失数据这样简单的事情会导致偏差模型。
最后,在现实世界中应用人工智能医学模型的主要挑战和机遇之一是更好地理解这些算法将如何与临床医生的决策交互。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-U3vTG0A5-1627814680155)(https://files.mdnice.com/user/15745/73331248-054a-4d34-b8f0-1acc2810f8ab.png)]
人工智能模型的一个局限性,即使是我们在本课程中看到的模型,也很难理解模型的内部工作原理,从而理解它们如何以及为什么做出某种决定。
在课程3中,我们将了解如何解释我们建立的胸部x光模型,以及了解这些算法的临床决策过程的几种不同方法。
祝贺您完成本周建立医学图像分割模型。您已经了解了MRI数据、深度学习体系结构和分割损失函数,以及评估方法。
在本周的作业中,你将看到所有这些想法是如何建立和评估你自己的脑肿瘤分割模型的。
最后,您现在也意识到了将这些模型作为临床护理的一部分所带来的一些挑战和机遇。
文章持续更新,可以关注微信公众号【医学图像人工智能实战营】获取最新动态,一个关注于医学图像处理领域前沿科技的公众号。坚持已实践为主,手把手带你做项目,打比赛,写论文。凡原创文章皆提供理论讲解,实验代码,实验数据。只有实践才能成长的更快,关注我们,一起学习进步~
我是Tina, 我们下篇博客见~
白天工作晚上写文,呕心沥血
觉得写的不错的话最后,求点赞,评论,收藏。或者一键三连
以上是关于第一课第三周7-10节-AI算法这么棒,为什么我们周围的医院没有使用这些系统?的主要内容,如果未能解决你的问题,请参考以下文章
第一课第三周3-4节--2D和3D分割的优缺点以及如何构建UNet模型