Nat Medicine亮点 | 谷歌AI开发3D深度学习算法精准预测肺癌风险
Posted BioArt
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Nat Medicine亮点 | 谷歌AI开发3D深度学习算法精准预测肺癌风险相关的知识,希望对你有一定的参考价值。
撰文 | 伊凯
责编 | 兮
肺癌是全球范围内最为常见的,也是在中国和美国等国造成最多死亡病例的癌症类型,全球每年有约160万人死于肺癌【1】。由于大部分肺癌患者在就医时已处于癌症晚期阶段,不适合手术治疗或治疗效果差,因此对肺癌的早期诊断和临床干预就显得尤为重要。然而,处于肺癌早期阶段的患者通常并无明显临床症状,仅靠常规X光检查极易漏诊;而另一方面,尽管胸部CT扫描具有显著更高的密度分辨率,但大规模采用CT筛查又会带来辐射剂量过高的风险。因此,诞生于上世纪九十年代的低剂量CT扫描(low-dose computed tomography, LDCT)凭借其低至常规CT十分之一的辐射剂量和相差无几的诊断敏感度成为了目前肺癌早期诊断的通行手段。
在美国,对肺癌高危人群中进行大规模LDCT筛查,并由放射科医生根据肺部结节大小、密度和生长状况等因素分析患癌风险,然后做出临床干预建议的方法,显著降低了患者死亡率(20-43%)【2】。不过,依据LDCT结果对肺癌风险进行预测仍然面临着诸多挑战,例如不同分析者间的显著打分差异、较高的假阳性和假阴性比例以及较低的分析效率【3】。无论从提升诊断精准度还是改善经济效益的角度,开发和广泛利用自动化的早期肺癌诊断流程都显得十分必要。
近年来,深度学习技术的飞速发展带动了多个现实领域的革命性变化。由今年三月刚获得图灵奖(ACM A.M. Turing Award)的人工智能三大巨头之一的Yann Lecun最初于1989年提出的卷积神经网络(convolutional neural network,CNN)【4】及其多种变体(下图),凭借精妙的模仿人类视觉认知层级结构设计的卷积(convolution)和池化(pooling)与非线性激活配合的算法特征,在计算机视觉(computer vision)的多个子领域的重要问题上(如人脸识别、图像语义分割、目标追踪和视频分类等)都取得了最好性能;其同时也依靠对局部序列特征的识别和提取能力被广泛运用至生物学领域中DNA/RNA-蛋白互作【5】、DNA甲基化【6】和染色体可接近性【7】预测等问题中。因此,CNN自然也成为了基于图像分析捕捉病理特征进行病理诊断的利器。
2019年5月20日,作为人工智能领域的领跑者之一的谷歌AI主导并联合斯坦福大学、西北大学和纽约大学的多个研究组在Nature Medicine上发表了题为End-to-endlung cancer screening with three-dimensional deep learning on low-dose chestcomputed tomography的研究,报道了利用3D深度学习算法预测肺癌的最新进展。
在该项研究中,研究人员设计了一种以三维Inception网络(CNN的一种变体)为核心本质为二元分类器(binary classifier)的复合型卷积神经网络,在输入端给予患者当前时段的胸部LDCT三维图像或配合以之前就诊时的图像,而在中间层则同时包含两部分分析路径:一是不加限制的LDCT三维全局图像分析,二是经由提前训练得到的对包含潜在肺部结节的局部结构的特异识别分析。最后,网络中的上述两条路径的输出值被合并在一起通过输出层计算导出为肺癌风险预测概率(下图)。
研究人员利用获取自美国国家肺癌筛查试验计划(National Lung Cancer Screening Trial, NLST)的一万多个病人的四万多个CT图像数据训练了这一网络结构,随后在测试集(test set)上获得了高达94.4%的ROC曲线(receiver operating characteristic curve, 以二元分类问题中的假阳性率为横轴,真阳性率/敏感度为纵轴)下面积(表征了分类效果与随机区分的差异程度)。更重要的是,当研究者安排六位平均执业年龄为8年的放射科医生对同一测试数据集进行肺癌患病风险打分时,发现他们的平均表现显著差于深度学习网络,且无任何一人具有更优表现(下图)。值得注意的是,医生在CT图像之外同时还具有病人的身份信息及临床历史信息。因此,通过大数据训练的人工智能模型在早期肺癌风险预测这一任务上表现出了优于人类专家的性能。
在另一项测试中,研究者为网络模型和放射科医生均同时提供了患者当前时段的CT图像及配对的之前诊断时的CT图像。通过不同时间点的CT图像判断肺部结节的生长状况亦是早期肺癌诊断的重要方式之一。由于具有这类前后时间点配对数据的病例相对较少,因此研究者观察到此次分析中无论是网络模型还是放射科医生的表现均较前一仅依据当前阶段CT图像的分析有所下降。不过,医生的预测表现仍然显著低于模型的预测表现,或两者持平(下图)。这一结果有力地证实了神经网络对肺癌预测的结果稳健性。
总之,该研究中通过对超大数据集的运用、对胸部CT图像的全局和局部特征的同时识别和提取,以及对不同时间点的CT图像的综合分析,实现了人工智能预测肺癌风险的现有最高精度,且被证明显著优于医生表现。其端对端的无需人工辅助的自动化流程也具有相当程度的便捷性和可靠性。同时,这一研究提出的网络结构具有较强的延展性和灵活的适应性,能够被运用至多种基于三维图像的病理状态分析任务中,因而在未来可预期成为病理分析的常规手段。
原文链接:
https://doi.org/10.1038/s41591-019-0447-x
制版人:小娴子
参考文献
1. Bray, F. et al. Global cancer statistics 2018: GLOBOCAN estimatesof incidence and mortality worldwide for 36 cancers in 185 countries. CA.Cancer J. Clin. (2018). doi:10.3322/caac.21492
2. Jemal, A. & Fedewa, S. A. LungCancer Screening With Low-Dose Computed Tomography in the United States—2010 to 2015. JAMA Oncol. 3, 1278 (2017).
3. Black, W. C. et al. Cost-Effectivenessof CT Screening in the National Lung Screening Trial. N. Engl. J. Med. (2014).doi:10.1056/NEJMoa1312547
4. LeCun, Y., Boser, B., Denker, J., … D. H.-N. & 1989, U. Backpropagationapplied to handwritten zip code recognition. Neural Comput (1989).
5. Alipanahi, B., Delong, A., Weirauch, M.T. & Frey, B. J. Predicting the sequence specificities of DNA- andRNA-binding proteins by deep learning. Nat. Biotechnol. 33, 831–838 (2015).
6. Sharma, C., Gupta, R. K., Pathak, R. K.& Choudhary, K. K. DeepCpG: accurate prediction of single-cell DNAmethylation states using deep learning. Fluoride 47, 15–22 (2014).
7. Kelley, D. R., Snoek, J. & Rinn, J.L. Basset: Learning the regulatory code of the accessible genome with deepconvolutional neural networks. Genome Res. 26, 990–999 (2016).
8. Liu, Y. et al. ArtificialIntelligence-Based Breast Cancer Nodal Metastasis Detection Insights Into theBlack Box for Pathologists. Arch. Pathol. Lab. Med. (2018).doi:10.5858/arpa.2018-0147
9. Sayres, R. et al. Using a Deep LearningAlgorithm and Integrated Gradients Explanation to Assist Grading for DiabeticRetinopathy. Ophthalmology (2019). doi:10.1016/j.ophtha.2018.11.016
BioArt,一心关注生命科学,只为分享更多有种、有趣、有料的信息。关注请长按上方二维码。投稿、合作、转载授权事宜请联系微信ID:bioartbusiness 或邮箱:sinobioart@bioart.com.cn。原创内容,未经授权,禁止转载到其它平台。
以上是关于Nat Medicine亮点 | 谷歌AI开发3D深度学习算法精准预测肺癌风险的主要内容,如果未能解决你的问题,请参考以下文章