机器学习法在改善急性髓系白血病的分类和预后中的应用
Posted 睿昂基因学术交流圈
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习法在改善急性髓系白血病的分类和预后中的应用相关的知识,希望对你有一定的参考价值。
引言:作为全球血液学领域最大最权威的国际学术盛会之一,第62届美国血液学会年会(ASH 2020)吸引了来自全球100多个国家的近三万名血液学专家、学者和其他专业人士参会,会议期间有数千份报告的精彩呈现。来自美国的Hassan Awada教授在本次ASH会议上报道了他们最新的研究:机器学习法在改善急性髓系白血病的分类和预后中的应用。
01
Introduction
体细胞或种系的遗传突变,细胞遗传异常共同作用导致急性髓细胞白血病(AML)具有异质性。具有典型致病融合基因的AML,如:translocation(8;21)/inversion(16)/translocation(15;17),仅仅能代表一部分具有特定预后的亚型,而对于大部分AML患者来说,发病机制是体细胞突变或细胞遗传异常再伴有许多获得性继发打击共同导致的。异常基因相互作用的复杂性可能使得无法对不同基因组进行分类,也无法区分经典病理形态学的AML亚型,如初诊AML(pAML)和由其他髓系肿瘤(MN)转化而来的AML(sAML)的差别。由于这些亚型的非特异性和早期髓系肿瘤的前驱症状史较短,无法将临床信息与这些AML亚型进行匹配。而基因组标志物具有对AML进行亚分类并提供客观的个性化预后的潜力,因此Hassan Awada等人根据基因组标志物建立了一个不需要相关临床病理信息,就能够对AML进行标准评估的预后判断模型。
02
Method and Results
利用标准方法和机械学习法对多中心组的6788名AML患者的基因数据和一些公开数据进行收集和分析。总共识别出13879个用于预测传统病理形态学中AML分类的体细胞变异。利用贝叶斯潜在类别分析确定了不同预后水平的基因组,通过存活率的分析进行验证。同时,建立预后判定模型(random forest model)将每个预后组和致病性特征配对,并利用准确性中值的降低对基因组特点进行评估。
图1:pAML和sAML中基因遗传和分子的关联
表A,B,C分别代表了pAML和sAML患者的存活率;NK-pAML和NK-sAML患者的存活率; AK-pAML和AK-sAML患者的存活率。在25个月后患者存活率出现差别,pAML组的存活率明显高于sAML组。表D代表了能够表征不同AML亚型的基因组的占比。表D和F表示pAML和sAML组中通过单变量分析和多变量分析检测到的突变的逻辑回归模型(LRM)。在表G表示用于区分pAML和sAML的基于初始基因突变和克隆基因突变的克隆性高风险分析。在表H中,LRM识别出的基因组图谱在重新使用时,预测性能的交叉准确性只有74%。
图2:pAML和sAM未记录的基因组分析揭示的特异性存活的新型AML预后组L中基因遗传和分子的关联
图A表示贝利叶潜在分析适用于具有完整突变筛选的AML病例,同时也适用于新的基因组亚组。图B表示随着时间的增长,4个预后风险组的存活率呈下降趋势,从高到低为LR,Int-Lo,Int-Hi,HR。图C表示不同预后风险水平在两组AML亚型中的比例,图D表示两种AML亚型在不同预后风险组中的比例,能够发现sAML组患者的存活率低于pAML组。图E表明,此RF模型和每个预后组的病理学特征结合后,预后的交叉准确性提升为97%。
图3:预后组的基因组特征
图A表示之前建立的RF模型通过准确性平均值的降低来量化基因组特征。图B,C,D,E表示四个预后水平组具有的基因组特征。LR组的特征是细胞遗传正常的概率最高(88%),都具有NPM1MT(100%; 86%的VAF> 20%),并同时具有的DNMT3AMT(52%),FLT3ITD-MT(27%; 91%发生率最高, VAF <50%),IDH2R140-MT(16%,IDH2R172-MT不存在),并存在ASXL1MT,EZH2MT,RUNX1MT,TP53MT和复杂细胞遗传学信息的缺失或减少。Int-Lo组的异常细胞遗传学病例百分比高于LR组,发生频率最高的是CEBPABi-MT(9%),IDH2R172K-MT(4%),FLT3ITD-MT(14%)和FLT3TKD-MT(6%),此时不存在NPM1MT,且呈现NPM1MT, ASXL1MT, RUNX1MT 和 TP53MT缺失。ASXL1MT(39%),BCOR / L1MT(16%),不带NPM1MT的DNMT3AMT(19%),EZH2MT(9%),RUNX1MT(52%),SF3B1MT(7%),SRSF2MT( 38%)和U2AF1MT(12%)在Int-Hi组中的出现频率最高。HR组异常细胞遗传学的患病率最高,占比为96%,其中-5 / del(5q)(68%),-7del(7q)(35%),-17del(17p)(31%)和TP53MT(70%)出现频率最高,且复杂核型的概率为(76%)。
图 4: RF模型分析结果及预测结果
图A ,B,C,D,代表利用随机森林模型对原始数据进行分析所得的存活率结果与使用额外手段进行分析后得到的结果类似。图E为可使用基于网络的开放数据的随机森林预后治疗模型和特定组的生存可能性预测。
03
总结
Hassan Awada等人通过将机器学习方法,基于7000例具有详细分子遗传学信息的大型AML患者队列,开发了一个用于AML亚型的分类和预后的分类和判断模型,准确性可达95%。这个模型可以对不同基因组特征进行量化,从而提高预后的精确度。且病理生物学和生存率相关的特征表明,该模型可以克服原本利用病理形态学进行分类的一些局限性,能够帮助我们真正进入个体化医学时代。
以上是关于机器学习法在改善急性髓系白血病的分类和预后中的应用的主要内容,如果未能解决你的问题,请参考以下文章