机器学习预测新兴污染物在植物中的吸收和转移:对食品安全的影响
Posted DrugAI
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器学习预测新兴污染物在植物中的吸收和转移:对食品安全的影响相关的知识,希望对你有一定的参考价值。
编辑:肖冉
摘要 ABSTRACT
今天介绍一篇由来自美国密苏里科技大学的Majid Bagheri等人发表在Science of the Total Environment上的一篇文章,其使用神经网络和模糊逻辑辅助探究植物根部和可食部位中污染物的积累。
01
介绍
目前,在人类母乳和血液中越来越多地检出EFCs(Emerging and fugitive contaminants)引发了人们对食用受污染作物影响人体健康的关注。作者通过RCF(根富集因子),可以测量环境污染物在植物根部的积累;通过FCF(果实富集因子),可以测量可食用部位中环境污染物的积累;此外,TSCF(蒸腾流浓缩系数)反映了植物吸收的效率。
此研究中,作者使用神经网络模型基于化合物的多种理化性质来预测RCF,包括log Kow(辛醇/水分配系数),分子量(MW),氢键供体(HBD),氢键受体(HBA),可旋转键(RB)和极性表面积(PSA)。基于有显著性的性质检查FCF和RCF的理化界值,并将结果与TSCF的进行比较,试图提高对那些更有可能积累在可食组织中的污染物的认识。使用统计分析来发现重要的化合物性质,并评估这些性质与root-water分配之间的相关性。通过模糊逻辑研究了理化性质对化合物在植物根和可食组织中积累的复合影响。
02
结果
2.1 使用神经网络(NN)预测RCF
作者根据数据训练结果,累积污染物的预测值和测量值之间的拟合可以接受,训练数据集的回归线表明RCF的测量值和预测值是相关的(见Fig.1)。
Fig.1 根据训练、验证、测试和所有数据集的用于
root-water分配的NN模型回归图
2.2 显著化合物性质及其与RCF的相关性
利用逐步回归方法研究了log Kow,MW,HBD,HBA,RB和PSA等化合物性质对root-water分配的重要性和显著性。Table 1的分析结果表明,MW,log Kow和RB依次是root-water分配最重要的化合物特性。在估计线性或广义线性模型时,作者考虑了多重共线性,评估了方差膨胀因子(VIF)。结果表明,在显著预测变量之间不存在多重共线性。相关性分析还显示,MW,log Kow和RB与RCF正相关。
Table 1 六个化合物性质与RCF的pearson相关性
2.3 化合物性质的复合影响和理化临界值
模糊逻辑的结果表明RCF与log Kow成正比。log Kow和RCF之间的关系为S型。亲脂性较高的化合物更容易分配到根脂质并在植物根部浓缩。植物根中亲水化合物的积累有一定限度。并且,随着RB的增加,RCF增加。此外,MW,log Kow和RB与RCF成正相关。试验结果显示:log Kow与FCF之间的关系呈钟形,而MW与FCF之间的关系呈S形。
2.4 污染物聚类
k-means算法将化合物划分为标记为(A)、(B)和(C)的簇,如Fig.2所示。
Fig.2 可视化植物根部中新兴污染物的显著化合物性质。
簇中化合物的其他性质(即在植物根部积累方面的非显著性质)示于Fig.3。结果表明,MW是化合物分类中最重要的性质。由模糊逻辑得出的界值极限与从k-means得出的界值极限一致。此外,对植物根部污染物的聚类分析证实,HBD,HBA和PSA的临界值与RCF呈负相关。
Fig.3 可视化植物根部中新兴污染物的非显著化合物特性
Fig.4显示了所得的组,植物可食用组织中新兴污染物的最显著聚类标准是k-means(k=3)。每个簇中的化合物具有相同的理化性质、吸收和转移特性。其理化性质平均值与通过模糊逻辑获得的理化临界值相匹配。簇(A)的log Kow和MW平均值分别为4.8和450 Da,FCF平均值为0.25,与不易穿过植物根膜的化合物具有相同的理化性质。簇(B)的log Kow和MW平均值分别为3.25和250 Da,最高FCF平均值为11,与中等疏水性化合物具有相同的特性,这些化合物很可能被吸收和转移。簇(C)的log Kow<0,MW<100 Da。可见亲水性化合物和重金属向植物可食用部分的转移少于中等疏水性化合物。簇(C)的平均log Kow,MW和FCF分别为-0.6,50 g / mol和1.2
Fig.4 可视化植物可食部分中的新兴污染物簇
2.5 高吸收污染物及其对粮食安全的影响
全氟化合物是FCF最高的污染物。具有中等疏水性(log Kow为2-3)的全氟化合物有着最高的生物富集,某些化合物的FCF最高达到243。根据已发表的研究,中等疏水性化合物具有最高的吸收效率和TSCF值。与可食用部分中检测到的化合物的理化性质与具有高TSCF的化合物相似。全氟化物是有毒化合物,包括全氟烷基物质和多氟烷基物质(PFAS),它们在环境和人体中非常持久,会随着时间的推移而积累而不会分解。已有证据表明人类接触PFAS可能导致不良健康影响。使用文中的机器学习模型预测生物富集因子非常重要,尤其是对于未经测试的化合物。生长在受污染的水和土壤中的食物可能存在PFAS污染。
与全氟化化合物相似,持久性有机污染物也因为其表现出高脂质溶解度,在脂肪组织中有高生物蓄积性和高稳定性。虽然log Kow值较高的化合物转移到地上组织的能力较低,但它们在根茎类蔬菜中很可能影响食品安全。
03
结论
作者的研究证明NN可有效预测植物根部中的环境污染物(即RCF),而模糊逻辑可有效评估环境污染物的理化性质之间的相互作用。模糊逻辑的结果表明,在可食部位检测到的污染物的理化阈值与跨过植物根膜(进入木质部组织)的更为相似,而不是积累在植物根部的阈值。使用k-means聚类的环境污染物聚类支持了模糊逻辑的发现。k-means的结果产生了基于化合物分子量的阈值,与从模糊逻辑获得的理化阈值相同。作者的研究结果表明,将机器学习技术与机械模型相集成可以提高我们对植物中环境污染物的吸收和转运的理解。
参考文献
Bagheri M , Al-Jabery K , Wunsch D , et al. Examining plant uptake and translocation of emerging contaminants using machine learning: Implications to food security[J]. Science of The Total Environment, 2020, 698:133999.
以上是关于机器学习预测新兴污染物在植物中的吸收和转移:对食品安全的影响的主要内容,如果未能解决你的问题,请参考以下文章