数据与方法流程 三个研究队列的具体特征如图1所示 本研究的工作流程概述如下图所示 结果展示 1.识别的微生物组合与2型糖尿病风险 作者利用LightGBM(Light Gradient Boosting Machine)确定了21个有助于2型糖尿病预测的特征,其中15个是微生物组学特征(unweighted_nmds6 and observed_species是微生物多样性的指标,其他则是分类相关特征)。这21个特征跟297个全部的输入特征相比显示出相似的预测能力,并且所选的大部分特征之间具有低到中等的相互关系。作者还发现LightGBM在预测2型糖尿病方面优于logistic回归和随机森林算法。这些选定的微生物特征比宿主基因和其他环境因素(FraminghamOffspring Risk Score (FORS) + lifestyle + diet)显示出更高的2型糖尿病预测准确性(图1A)。将选定的微生物组特征添加到模型(FORS + lifestyle + diet)中,在内部验证队列(P = 0.0024)中曲线下面积从0.63(95% CI 0.55–0.71)增加到0.73(95% CI 0.66–0.8),在内部测试队列(P = 0.016)中曲线下面积从0.66(95% CI 0.57–0.76)增加到0.73(95% CI 0.65–0.82),在外部验证队列1(P = 0.0036)中从0.51(95% CI 0.45–0.57)增加到0.64(95% CI 0.56–0.71)。在发现队列(p = 0.49)和验证队列1(p = 0.14)中,排除糖尿病前期患者前后基于微生物组的分类器的预测性能没有显著差异。
为了估计2型糖尿病发展过程的个体微生物风险,根据14个识别出的微生物群特征(表2)生成了MRS(microbiome risk score)。在发现队列(RR (risk ratio) 1.28,95% CI 1.23–1.33)、外部验证队列1(RR 1.23,95% CI 1.13–1.34)和外部验证队列2(RR 1.12,95% CI 1.06–1.18)中,MRS(MRS的每1个单位变化)始终与2型糖尿病风险呈正相关(图1B)。作者还发现基于发现队列(包括159例2型糖尿病患者)中1068个鸟枪式宏基因组样本的数据,MRS与2型糖尿病的关联可以被重复。与16S rRNA结果一致,基于元基因组的MRS始终显示与2型糖尿病风险呈正相关(新MRS的每单位变化:RR 1.33,95% CI 1.17–1.51)(图1B)。然而基于传统方法得出的MRS结果无法在两个外部队列中得到验证。