机器学习CT图像来预测肺结节良恶性及浸润程度
Posted 知识城邦
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习CT图像来预测肺结节良恶性及浸润程度相关的知识,希望对你有一定的参考价值。
2021-02-24农历正月十三
每天精选一篇文献,陪你度过2020的365天
知识城邦,每天都能了解最前沿的肿瘤研究进展
(总第769篇,2021第54篇,知识城邦陪伴您的第3年)
当CT发现肺结节时,要想确诊就必须通过穿刺活检或者手术切除来获取病理。
然而,这两种方法都是有创操作,可能会给患者带来一些并发症。
近年来,随着人工智能席卷全球,机器学习作为实现人工智能的方法,已经被证实可以帮助临床医生通过自动读取CT图像来诊断肺结节。
那基于机器学习算法的CT图像来预测肺结节良恶性及浸润程度的准确度有多高呢?我们来看一项最新发表在JTCVS杂志的研究。
利用机器学习CT图像预测肺结节良恶性及浸润程度
Abstract
— 目的—
探讨机器学习算法能否单纯通过CT图像来预测肺结节是良性、腺癌还是浸润前病变。
To investigate if machine learning algorithms can predict whether a lung nodule is benign, adenocarcinoma, or its preinvasive subtype from Computed Tomography (CT) images alone.
— 方法—
从不同来源收集含有肺结节的胸部CT扫描资料,并结合病理诊断进行分析。数据集被随机分成训练集(占70%)、内部验证集(占15%)和独立测试集(占15%)。
共开发了两种机器学习算法并分别进行了训练和验证。第一种使用支持向量机(SVM)模型(下图为2个SVM模型对肺结节纹理提取并三维重建的例子)
第二种使用深度学习技术,即卷积神经网络(CNN)。
通过ROC分析来评估模型在测试数据集上的预测性能。
A dataset of chest CT scans containing lung nodules was collected with their pathologic diagnosis from several sources. The dataset was split randomly into training (70%), internal validation (15%), and independent test sets (15%) at the patient level. Two machine learning algorithms were developed, trained, and validated. The first used the support vector machine (SVM) model, the second used deep learning technology, namely a convolutional neural network (CNN). Receiver-operating characteristic (ROC) analysis was used to evaluate the performance of the classification on the test dataset.
— 结果—
训练集共包含1711名受试者,2516个肺结节。
内部测试集共284个肺结节,分布如下:
外部独立验证集共212个肺结节:
为了方便评估这两种模型预测腺癌组织亚型的能力,将其共分为6类进行比较:
基于SVM/CNN两种模型的诊断能力分别如下:
区分非典型腺瘤性增生(AAH)与原位腺癌(AIS)的AUC值分别为0.59/0.65,
区分微浸润腺癌(MIA)与浸润性腺癌(IA)的AUC值分别为0.87/0.86
区分AAH+AIS与MIA的的AUC值分别为0.76/0.72
区分AAH+AIS与MIA+IA的的AUC值分别为0.89/0.87
区分AAH+AIS+MIA与侵袭性腺癌(IA)的AUC值分别为0.93/0.92。
区分良性与浸润前病变(AAH+AIS+MIA)及浸润性腺癌,SVM/CNN两种模型的最小平均AUC值分别为0.93和0.94。
基于CNN的方法比基于支持向量机的方法具有更高的灵敏度,但特异性和准确性更低。
The SVM / CNN based models classified nodules into six categories resulting in an area under the curve (AUC) of: 0.59 / 0.65 when differentiating Atypical Adenomatous Hyperplasia (AAH) vs Adenocarcinoma in Situ (AIS), 0.87 / 0.86 with Minimally Invasive Adenocarcinoma (MIA) vs Invasive Adenocarcinoma (IA), 0.76 / 0.72 AAH+AIS vs MIA, 0.89 / 0.87 AAH+AIS vs MIA+IA and 0.93/ 0.92 AAH+AIS+MIA vs IA. Classifying Benign vs AAH+AIS+MIA vs IA resulted in a micro-average AUC of 0.93/0.94 for the SVM/CNN models, respectively. The CNN-based methods had higher sensitivities than the SVM-based methods but lower specificities and accuracies.
— 结论—
机器学习算法仅凭CT图像就能较好地区分良性结节、浸润前病变和浸润性腺癌。但预测的精确度因其不同子分类而异。该结果说明机器学习识别CT图像具有以更少的侵入性手段提高诊断的潜力。
The machine learning algorithms demonstrated reasonable performance in differentiating benign vs preinvasive vs invasive adenocarcinoma from CT images alone. However, the prediction accuracy varies across its’ subtypes. This holds the potential for improved diagnostic capabilities with less invasive means.
©知识城邦 苟日新,日日新
点赞和转发的都能发Nature
以上是关于机器学习CT图像来预测肺结节良恶性及浸润程度的主要内容,如果未能解决你的问题,请参考以下文章
《Python机器学习及实践》----良/恶性乳腺癌肿瘤预测