AI医学 | “机器学习”在原发性肝癌诊疗中的应用进展

Posted 医学AI在线AIMonline

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了AI医学 | “机器学习”在原发性肝癌诊疗中的应用进展相关的知识,希望对你有一定的参考价值。

单位:解放军总医院第一医学中心介入超声科


原发性肝癌(HCC)的发病率和病死率均居所有肿瘤的前5位。在我国,肝癌居常见恶性肿瘤发病率的第4位和肿瘤致死病因的第3位,严重威胁民众健康。随着对肝癌致病因素、早期诊断、血清学生物标志物、基因组学、代谢组学、影像、病理、治疗、疗效评估、复发预测、生存分析等方面研究的持续深入,大量相关数据被积累起来。近年来,大数据、数据挖掘、云计算、人工智能等分析技术的出现及迅猛发展,为分析肝癌患者的大量数据提供了便捷手段,而处理大数据的多种工具背后都有“机器学习”的应用。“机器学习”致力于研究通过计算的手段,利用经验来改善数据处理系统的相关性能。在计算机系统中,“经验”通常以“数据”的形式存在,因此,“机器学习”所研究的主要内容是关于在计算机上从数据中产生“模型”的算法,即“学习算法”。有了学习算法,便能基于这些积累的大量数据产生模型,然后在面对新的肝癌患者时,模型会提供相应的判断与预测(如诊断、预后、复发风险、疗效等)。现就“机器学习”方法在HCC诊疗中的部分应用进展介绍如下。



构建模型优化影像学检查


通过“机器学习”构建模型优化影像学检查是近年HCC诊疗相关研究的热点。基于计算机断层扫描(CT)或MRI的肿瘤病灶检测和分割在临床诊疗中具有重要价值。由于人工分割效率低、主观性强等局限性,基于先进计算技术的自动精确分割越来越受到人们的青睐。


Conze等基于超体素的尺度将自适应随机森林用于动态增强CT扫描中肝癌分割,提出了一个从动态增强CT扫描中评估肿瘤坏死率的分类框架。通过连接分层多尺度树上的多阶段特征来描述树叶超体素,使得随机森林能够自动推断信息最丰富的尺度,而无须定义任何关于如何组合它们的显示规则,并通过临床数据的评估进行了验证。Lu等通过卷积神经网络(CNN)和图形切割开发了一种具有细化功能的深度学习算法自动分割肝脏。首先使用3DCNN同时进行肝脏检测和概率分割,然后使用图割和先前学习的概率图对初始分割的精度进行细化。该方法是全自动的,无须任何用户交互;定量结果显示,肝体积估计有效且准确;自动和手动参考之间具有高度相关性,可以很好地代替手动方法。


从腹部3DCT图像检测和描绘肝脏,是计算机辅助肝脏手术计划中的基本任务。然而,由于复杂的背景、模糊的边界、异质的外观和高度差异的肝脏形状,实现自动准确地分割,尤其是肝脏检测仍然具有挑战性。为了解决这些困难,Hu等提出了一种基于3DCNN深度学习和全局优化表面演化的自动分割框架。首先对3D深度CNN进行训练,以学习特定对象的肝脏概率图,给出初始表面并在随后的分割步骤中充当形状;然后将来自先前分割的全局和局部外观信息自适应地合并到分割模型中,通过表面演化方式进行全局优化。该方法在公共Sliver07数据库和当地医院42幅CT图像上的应用显示其准确、有效。


从CT图像进行多器官分割是计算机辅助诊断和手术计划的重要步骤。然而,影像医师手动描绘器官是乏味、耗时且可重复性差的。Hu等采用深度CNN进行器官检测和分割,并通过时间隐式多阶段演化方法进一步完善,并在140次腹部CT中进行评估,以分割4个器官(肝、脾和双肾);结果显示,肝脏、脾脏和两个肾脏的平均骰子重叠率分别为96.0%、94.2%和95.4%,并且所有分割器官的平均对称表面距离均小于1.3mm,精度可与具有更高效率的最新方法相媲美,具有很高的有效性和效率。


Wang等开展了肝肿瘤诊断的深度学习研究,利用放射成像特征的CNN开发一种概念验证的“可解释的”深度学习原型,获得了76.5%的阳性预测值和82.9%的灵敏度,能够识别测试病灶中正确的影像特征。通过提供关于各种放射学特征在执行鉴别诊断中的重要反馈,能与标准化报告系统(如LI-RADS)对接,验证辅助特征,提高临床实用性,并添加定量数据,提供诊断决策支持。该团队还进行了基于概念验证CNN的深度学习系统(DLS)在多期MRI上对常见肝脏病变进行分类的研究。通过迭代优化网络结构和训练实例,设计定制的细胞神经网络,进行培训和蒙特卡罗交叉验证;并将最终CNN的分类准确性与两名高年资医师在相同测试集上进行比较。结果显示,DLS显示出更高的准确性、敏感度和特异性。对于HCC分类的敏感度为90.0%,真阳性率为93.5%,假阳性率为1.6%,受试者操作特征面积在曲线下0.992,每个病灶的计算时间为5.6ms。研究显示,深度学习在容积多相MRI上对肝脏病变的分类表现出很高的性能,提示其可作为放射科医师最终决策支持工具的潜力。展示每个病变仅需要几毫秒的分类时间,DLS有望以省时的方式并入临床工作流程。


Pang等报告了一种用于肝癌图像识别的凹凸变优化稀疏贡献特征选择和分类器,以一种凹凸变分(CCV)方法来优化3种分类器(随机森林分类器、支持向量机分类器和极限学习机分类器),以获得更准确的肝癌图像分类结果。首先利用双边滤波对病理图像进行增强处理,在病理科医师的指导下得到每个HCC图像块;然后在提取每个块的完整特征后,建立新的稀疏贡献(SC)特征选择模型,为每个分类器选择有益的特征;最后提出凹凸变分方法来提高分类器的性能。使用1260块HCC图像块进行的实验显示,该研究提出的CCV分类器比每个原始分类器都有显著提高,其中CCV-随机森林对HCC图像的识别效果最好。



构建模型预测肝癌发生和术后复发与生存的风险


临床医师在循证医学的基础上评估每例HCC患者的治疗,由于个体之间的生物多样性,并不总是适用于特定的患者。针对HCC,多年来业界一直在开发辅助临床医师决策的策略,使用计算方法(如“机器学习”技术)从临床数据中提取信息;但仍有一些尚未解决的局限性:部分研究没有完全集中在HCC患者身上,有些有严格的应用范围,没有考虑患者之间的异质性或缺失数据的情况,这是当前医疗保健中的常见缺点。


Santos等研究了一个包含不同临床特征的较为复杂的HCC数据库,提出新的基于聚类的过采样方法,对小数据集和不平衡数据集具有鲁棒性,可以解释HCC患者的异质性。这项工作的预处理过程是基于考虑异构数据和缺失数据的适当距离度量的数据补偿(HEOM)和聚类研究来评估研究数据集中的潜在患者组(K-Means)。应用最后一种方法是为了减小的患者数据对生存预测的影响。它基于K-均值聚类和SMOTE算法构建一个具有代表性的数据集,并将其作为不同“机器学习”过程(Logistic回归和神经网络)的训练样本。根据生存预测对结果进行评估,并使用Friedman秩检验对不考虑聚类和(或)过抽样的基线方法进行比较。该研究者认为结合神经网络的方法优于所有其他方法,提示其比目前在HCC预测模型中使用的经典方法有所改进。


Abajian等使用有监督的“机器学习”预测HCC动脉内的治疗反应。通过应用“机器学习”技术,利用MRI和临床患者数据,建立一个预测肝动脉化疗栓塞治疗结果的人工智能(AI)框架。接受肝动脉化疗栓塞治疗的HCC共36例,分别于化疗栓塞前和栓塞后1个月行MRI检查,使用三维定量欧洲肝脏研究协会(QEASL)标准评估基于图像的肿瘤对经动脉化疗栓塞的反应。临床信息、基线影像和治疗特征被用来训练Logistic回归(LR)和随机森林(RF)模型,以根据QEASL反应标准预测患者为治疗应答者或无应答者。采用留一法交叉验证对每个模型的性能进行验证。LR和RF模型预测肝动脉化疗栓塞治疗反应的总准确率为78.0%(敏感度62.5%,特异性82.1%,阳性预测值50.0%,阴性预测值88.5%)。治疗反应的最强预测因子包括临床变量(是否存在肝硬化)和影像学变量(相对肿瘤信号强度>27.0)。研究结果显示,通过结合临床患者资料和基线MRI成像,结合AI和“机器学习”技术,可以在手术前预测HCC患者经动脉化疗栓塞的结果。


Tseng等基于合并算法和统计测度的多时间序列进行临床数据分类处理。对患者情况的描述应包括临床措施的变化和组合。传统的数据处理方法和分类算法可能会导致临床信息的消失,降低预测性能。为了利用多个测量值提高临床结局预测的准确性,研究提出了一种新的周期合并的多时间序列数据处理算法。该研究采用HCC83例的临床资料,使用所提出的合并算法合并他们在规定时间内的临床报告,并计算统计指标。经数据处理后,采用径向基函数(RBF)核的多测量支持向量机(MMSVM)作为肝癌复发预测的分类方法。多测量随机森林回归(MMRF)也被用作附加的评价与分类方法。为了对数据合并算法进行评估,比较了处理后的多个测量值的预测性能和使用单个测量值的预测性能。采用径向基函数的最小二乘支持向量机预测复发120天的结果最优(准确度0.771,平衡准确度0.603),优于单次测量结果(准确度0.626,平衡准确度0.459,P<0.01)。在MMRF的情况下,应用所提出的合并算法后的预测结果也优于单次测量结果(P<0.05)。结果显示,使用该研究提出的数据处理算法可以显著提高肝癌复发预测的性能,并且多个测量值可能比单个测量值更有价值。


Divya等研究了基于APO算法的优化肝癌复发预测多时间序列临床肝癌数据集。射频消融治疗HCC后复发与未复发的分类是一项重要工作。从不同的数据集和不同的时间间隔收集多个时间序列的肝癌临床数据集。使用合并算法来合并在多个时间段内从不同来源收集的所有属性。为了保持信息的原创性,计算了每个属性的统计测度,并将其作为附加属性进行精确预测。然而,合并后的数据集是不平衡的,其中来自HCC复发类的样本数量比来自HCC非复发类的样本数量要少得多。特征加权方案选择最优特征和分类器参数是从多次迭代中依次获得的,计算时间较长。该文提出了一种基于逆随机欠采样(IRU)的有效采样方法,以克服类不平衡问题。对样本下的病毒多数类别创建多个不同的分区,其中有边界分隔的少数类别样本和多数类别样本。此外,为了提高分类的有效性和效率,提出了一种利用人工植物优化(APO)算法来选择分类器的最优特征和参数的优化方法。该优化方法减少了对肝癌复发和未复发进行分类的分类器的特征选择和参数选择的迭代次数和计算时间。利用支持向量机(SVM)和RF分类器,基于最优特征和参数对HCC患者和非HCC患者进行分类。最后,实验测试结果显示,该方法在准确度、特异性、敏感度和均衡性等方面比现有方法更为有效。


Chen等设计了一个预测中期肝癌患者常规肝动脉化疗栓塞后预后的新模型,并进行了初步的验证。常规经导管动脉化疗栓塞术(CTACE)治疗的中期HCC患者预后具有很大的异质性。该研究旨在开发一种新的生存预测模型,以帮助选择更好地从CTACE治疗中获益的患者。作者收集了接受CTACE作为一线治疗的巴塞罗那分期(BCLC)B期肝癌848例的数据。通过单因素和多因素Cox回归分析得出预后模型变量。通过交叉验证和自助法(Bootstrap)重采样计算的一致性指数(C-统计量)用于模型选择。对作者最终的预测模型的校准也进行了评估。与Bolondi等的BCLC B1-B4亚型相比,该模型对BCLC B期患者的预后具有更好的判别能力(C-统计量为0.66)。在交叉验证中,Bootstrap重采样显示模型保持了足够的区分性(C-统计量的平均值为0.66)。模型校准在预测与观察结果相匹配的患者生存方面是准确的。在有效患者生存期提高18个月或以上的基础上,各反应类别(有效或无应答)患者的观察结果与模型预测的结果基本相符。根据患者、肿瘤和肝功能的临床特征,该研究者开发了一种比Bolondi的分级系统更好的预测模型,用于CTACE后的中期HCC患者,可以帮助确定适合CTACE治疗的BCLC B期患者的不同亚群。


Mai等采用血清白蛋白-胆红素评分(ALBI)联合谷草转氨酶-血小板比值(APRI)预测乙型肝炎病毒(HBV)相关性肝癌患者的肝切除术后肝功能衰竭(PHLF)。PHLF是HCC患者肝切除术后的严重并发症。该研究旨在探讨ALBI评分与APRI值相结合作为预测HBV相关性肝癌患者PHLF风险的新方法。研究对象为2006年1月-2013年10月接受肝切除术的HBV相关性肝癌1055例。结合ALBI评分和APRI值构建预测PHLF风险的新模型,并与Child-Pugh(C-P)分级、ALBI评分和APRI值进行比较。回顾性研究显示,其中151例经历过PHLF。单因素和多因素分析结果显示,ALBI评分和APRI值是PHLF的独立预测因子。ALBI评分、APRI值和C-P分级的ROC曲线下面积分别为0.717、0.720和0.602。结果提示,ALBI评分结合APRI值在预测PHLF风险方面比C-P分级具有更高的判别能力;ALBI-APRI模型比单独使用ALBI评分或APRI值可提高预测PHLF的能力。ALBI-APRI评分是预测HBV相关性肝癌患者PHLF的一种新的、有效的模型,其预测PHLF危险性的准确度优于C-P、ALBI评分和APRI值。


祁亮等通过TCGA数据库基因突变信息结合“机器学习”软件RapiMiner构建HCC患者复发模型。收集了HCC316例的临床资料和全基因组测序的突变基因信息,利用R语言和SPSS19.0软件筛选出前127个高频突变基因和与无疾病生存期(DFS)显著相关的高频突变基因12个,利用RapiMiner8.0软件训练决策树和支持向量机(SVM)模型。结果显示,决策树模型准确率为77.4%,通过构建SVM模型佐证决策树模型的最大准确率为77.4%。提示,通过公共数据库构建的HCC患者的复发模型,可分析基因检测报告,可以提供药物治疗靶点信息,并初步判断预后。



构建模型分析肝癌组织蛋白表达


Liao等采用“机器学习”方法鉴定含DEP结构域的蛋白质及其在人肝癌组织中的表达。实验分析DEP结构域蛋白(DEP DC)有7个成员,然而,这个超家族是否能够仅仅根据氨基酸序列与其他蛋白质区分开来,还是未知数。该研究描述了一种分离DEP DC和非DEP DC的计算方法。首先检查已知的DEP DC的Pfam数,并使用每个Pfam的最长序列来构建系统发育树。随后提取DEP DC和非DEP DC的188维(188D)和20D特征,并用RF分类器对其进行分类。同时挖掘人类DEP DCs的基因序列,以寻找相关的结构域。最后设计了人DEP DC在HCC及癌旁正常组织中mRNA水平的实验验证方法。模体或基序(Motif)分析显示,DEP和RhoGAP结构域在人DEP DCs、人肝癌和广泛表达DEP DCs的邻近组织中普遍存在,成功构建了DEP DCs的二元分类器,并通过实验验证了其在人肝癌组织中的表达。



小结及展望


我国医疗数据资源丰富,但在医疗数据“机器学习”应用方面与领先的国家相比还有一定差距。究其原因,与我国医疗数据规范化不足、缺少统一的数据标准、缺乏多中心的协同共享以及统一监管等有关。未来,随着计算机科学和深度学习的不断进步,“机器学习”在肝癌研究领域的应用会更加宽广和深入,新的优秀算法会不断出现,使构建的模型准确度越来越高,泛化能力越来越强,在HCC的诊疗中有望发挥更大的作用。


本文转自肿瘤医学论坛(内容整理自人民军医2020年4月第63卷第4期 ),仅作分享,不代表官方立场及观点,如有侵权,请及时联系我们。


投稿邮箱:aimonline@163.com



往期精选






 

长按识别关注

扫描二维码

获取更多精彩内容

点它,分享点赞在看都在这里




以上是关于AI医学 | “机器学习”在原发性肝癌诊疗中的应用进展的主要内容,如果未能解决你的问题,请参考以下文章

医学人工智能辅助诊疗引发的伦理责任问题探讨

用AI解密眼底世界

影像组学研究基于支持向量机的MRI影像组学方法鉴别不同病理分型原发性肝癌的价值

厦大肝癌研究成果登《细胞》顶刊背后:一作中途离世,捐献遗体用于医学研究...

第二届医学影像智能定量学习班 -脑影像机器学习专题培训班

学校医院交通都AI+,上海发布12个人工智能试点应用场景