比DFT快6个数量级!机器学习超快准确预测宿主材料对多硫化锂的吸附机理
Posted 能源学人
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了比DFT快6个数量级!机器学习超快准确预测宿主材料对多硫化锂的吸附机理相关的知识,希望对你有一定的参考价值。
近年来,由于能源需求的增加,二次电池系统得到了广泛的研究,如锂离子电池、锂硫电池、锌离子电池、钠离子电池等。在这些储能系统中,锂硫电池因其理论能量密度高、硫含量丰富而备受关注。然而,多硫化锂(LiPS)的穿梭效应严重降低了电池的循环寿命,这是一个致命的缺陷,未来仍是一个巨大的挑战。在充放电过程中,生成的Li2S4、Li2S6和Li2S8等可溶性多硫化物会迁移到锂金属负极上与之反应,造成不可逆的容量损失。作为一种有效的方法,一些材料被引入作为载硫材料,以提供与多硫化锂强大的结合强度。例如,金属氧化物、硫化物、磷化物、氮化物可以有效锚定LiPS并抑制穿梭效应,从而提高电池循环稳定性。然而,目前仍然很难获得在宿主材料的不同点位(例如顶部、桥、洞点位)对LiPS的结合能,因此必须进行重复且枯燥的实验来探索各种宿主材料对穿梭效应的抑制能力。
随着计算化学的迅速发展,第一性原理计算已被引入锂硫电池领域,以预测宿主材料对LiPS的锚定强度。值得注意的是,在迁移和转化过程中会出现不同构型的LiPS,因此有必要研究任意空间构型、随机点位的结合能。不幸的是,由于昂贵的计算资源,计算结合能成本高,耗时长。诸如支持向量回归、人工神经网络、决策树等机器学习(ML)方法已经被引入到材料和化学领域。ML法可以大大降低计算成本,为快速寻找具有特殊性质的新材料或结构提供了一种有效的方法。以往的储能材料筛选、电池循环寿命预测、晶体结构预测、蛋白质能量预测等研究都充分印证了ML方法的成功。因此,在锂硫电池系统中使用ML法对实验研究或理论计算都是颇具价值的。此外,LiPS在宿主材料上的吸附趋势作为影响电化学性能的重要因素,将基于机器学习法被清楚地捕获到。
图1. 基于人工智能(AI)方法的锂硫电池穿梭效应抑制原理图,其中ML被用来预测不同LiPS在宿主材料上的结合能,防止LiPS向负极扩散,从而抑制穿梭效应。
【成果简介】
基于此,近期上海交通大学李金金研究员和安徽师范大学刘金云教授共同提出了一种超快速和精确的机器学习方法来预测吸附在具有任意构型和随机点位的宿主材料上LiPS的结合能,该方法可以综合评价这些宿主材料对锂硫电池穿梭效应的抑制作用。由于层状材料具有丰富的活性点位和较大的表面积,因此被广泛用作宿主材料,本工作以MoS2和WS2为例,基于从零训练(FS),预测了MoS2上成千上万个LiPS的结合能。FS训练时,模型参数按照均匀分布随机初始化,从输入的训练数据中学习所有特征。得到了MoS2/Li2S4、MoS2/Li2S6和MoS2/Li2S8化合物的三个初始预测模型。为了降低DFT的计算成本,将转移学习(TL)方法与机器学习(ML)方法相结合,用少量的密度泛函理论数据训练WSe2/Li2S4、WSe2/Li2S6和WSe2/Li2S8的结合能预测模型。
本文提出的ML法与DFT法具有相同的预测精度,但比其快6个数量级。最重要的是,基于TL训练,只需要1/7的数据集就可以显示出很高的预测精度,而不是像FS训练那样需要数千甚至数万个数据集。所提出的机器学习方法实现了对具有任意构型和活性点位的宿主材料的LiPS结合强度的准确和快速预测。相关成果以“Ultra-fast and accurate binding energy prediction of shuttle effect-suppressive sulfur hosts for lithium-sulfur batteries using machine learning”为题发表在了Energy Storage Materials期刊上,上海交通大学李金金研究员和安徽师范大学刘金云教授为该文章的共同通讯作者。
图2. 吸附模型的DFT和ML方法示意图,其中机器学习比DFT快6个数量级。
【核心内容】
1. DFT计算MoSe2/WSe2对LiPS的结合能
本研究以典型的二维层状结构MoSe2和WSe2为例,验证了所提出的ML法的可行性和准确性。构建了具有三层原子层的MoSe2和WSe2作为吸附Li2S4、Li2S6、Li2S8的基底。众所周知,ML法通常需要数据集。如图2所示,我们首先通过密度泛函理论(DFT)将LiPS(Li2S4,Li2S6,Li2S8)定位在具有任意空间构型和随机点位的MoSe2/WSe2基底上,计算了单点结合能。更详细的内容请参见计算方法部分。然后,获得由数千个DFT结合能组成的数据集,用于后续的ML训练。
为了更好地观察吸附趋势,从数千个计算的吸附化合物中选择了2个正负能最高的结构,这两个结构代表了我们数据集中最强和最弱的吸附。另外,对其他5个结构进行了随机筛选。然后,对这7种结构进行了分析,观察了它们的吸附趋势。三种吸附分子(Li2S4、Li2S6、Li2S8)在两种基底(MoS2和WSe2)上的吸附趋势基本相同。图3显示了DFT计算MoSe2在Li2S4上的结合能和相应的吸附结构,其中Li2S4分子中的S原子与暴露在MoSe2基底中的Se原子接触时的结合能为1.59,1.10和0.34 eV(图3a(1)(2)(3))。正结合能表明Li2S4分子处于不利构型,容易从MoSe2表面逸出或转换为其他构型再进行吸附。图3b显示了MoSe2对Li2S4的吸附结构的侧视图和俯视图,其中图3b(1)~(7)表示基底从与S原子接触到与Li原子接触的转换。从图3b(1)~(7),结合能从正到负逐渐变化,表现出良好的吸附趋势。在所选的7种构型中,-0.90 eV的结合能代表了Li2S4在MoSe2上最稳定的吸附,从而得出锂硫电池结合能越负,对穿梭效应的抑制越强。在构型转换过程中,由于金属和非金属元素之间具有良好的化学亲和力,Li2S4容易在MoSe2基底表面形成Li-Se键,表现出良好的吸附倾向。相反,对于非金属元素,S和Se原子之间存在排斥力,导致构型不稳定。WSe2基底也表现出与Li2S4相似的吸附趋势(图4a,b),对应的结合能范围为1.96~-0.85 eV,与WSe2基底接触的Li2S4分子中的S或Li的结合能为1.96~-0.85 eV。由此可见,极性键的形成是产生强烈抑制作用的关键,这使得极性化合物成为重要的硫载体材料。
2. MoSe2对LiPS结合能的预测
作为用于FS训练的ML数据集,其样本空间的丰富性至关重要。分别产生了3295、3800、4300种不同构型(包括平移和旋转)的LiPS吸附在MoSe2表面。用DFT计算了这些构型的结合能(ΔEb)。如此庞大的数据集不仅可以有效地覆盖样本空间,而且可以满足ML对训练数据的要求,从而掌握准确的模型。对于MoSe2/Li2S4,3295个单点结合能被随机分为2800:495(约6:1)作为训练数据和测试数据。图5显示了基于FS训练的结合能与DFT及ML的关联图。从图5a中的对角线来看,训练数据和测试数据都是具有低误差的统计数据,其以y=x从-1到2.5 eV为中心。表1显示了MoSe2对Li2S4、Li2S6、Li2S8的数据集和平均绝对误差,其中对于Li2S4,训练数据和测试数据的平均绝对误差分别为0.057和0.091 eV;对于Li2S6,训练数据和测试数据的平均绝对误差分别为0.073和0.12eV;对于Li2S8,训练数据和测试数据的平均绝对误差分别为0.095和0.112 eV。根据DFT计算的ΔEb减去测试的ΔEb而得到的直方图,其呈类似的高斯分布,中线为零,左右对称。结果表明,MoSe2/Li2S4的结合能预测模型较好。随后,对于MoSe2/Li2S6和MoSe2/Li2S8,也获得了理想的结果,如图5b,c所示。对于MoSe2/Li2S6,训练数据和预测数据的平均绝对误差只有0.073和0.12 eV;而MoSe2/Li2S8的为0.095和0.112 eV。
结果表明,ML预测的结合能与DFT预测的结果吻合较好,没有系统的高估或低估,从而验证了ML预测的结合能与DFT计算一致性。最重要的是,对于单CPU计算,ML预测的结合能所需的时间是毫秒,比用多CPU的DFT方法进行的几十分钟计算快6个数量级。该方法不仅基于ML确定了吸附在MoSe2表面任意点位的LiPS的结合能,而且达到了DFT水平的预测精度,比DFT计算快6个数量级。
图3. DFT计算了MoSe2和Li2S4之间的结合能,它们具有不同的构型和活性点位。a) MoSe2对Li2S4不同构型的结合能。b) MoSe2对Li2S4不同构型的俯视图和侧视图。
图4. DFT计算了WSe2和Li2S4之间的结合能,它们具有不同的构型和活性点位。a) MoSe2对Li2S4不同构型的结合能。b) WSe2对Li2S4不同构型的俯视图和侧视图。
表1 基于FS训练的MoSe2对Li2S4,Li2S6,Li2S8的数据集和平均绝对误差
图5. 结合能与DFT和ML的关联图,以及误差分布的直方图。结果是通过FS训练获得的。
3. WSe2对LiPS的迁移学习(TL)法
为了在保持与MoSe2/LiPS相同的预测精度的同时缩短计算时间,采用TL法对WSe2/LiPS的结合能进行了预测。TL法优点是能够将为特定预测模型学习的有效特征和数学含义从一大组数据源转移到相似领域的小目标数据集。在本研究中,基底(MoSe2或WSe2)和吸附分子(Li2S4、Li2S6、Li2S8)的化合物被认为是两个相似的结构域。因此,用DFT计算WSe2/LiPS的结合能只有1500个。
对于这三个系统,使用9:1的比例来划分数据集,得到450个样本作为训练集,50个样本作为测试集。首先,采用了与MoSe2/LiPS模型相同的FS训练方法,在此过程中随机初始化神经网络的连接权值。图6a显示了WSe2/Li2S4预测的FS性能,其中训练数据和预测数据有很大的误差,结合能与DFT及ML的关联图几乎是杂乱无章的。图6中每个图形的插入显示了具有非零中线的高斯分布的直方图。接下来,基于TL法,对MoSe2/Li2S4预测中训练好的参数进行了微调,作为WSe2/Li2S4预测的初始化参数。图6b显示了TL对WSe2/Li2S4模型的结果,与图6a的FS结果有很大不同。图6c-d和图6e-f显示了WSe2/Li2S6和WSe2/Li2S8的ML预测结合能及DFT计算的结合能的比较,其中图6c,e由FS训练,图6d,f由TL训练。
图6 WSe2/Li2S6和WSe2/Li2S8的ML预测结合能及DFT计算的结合能的比较。
通过TL训练取得了显著的成果,每个系统只有500个单点结合能。对于WSe2/Li2S4,训练数据和预测数据的平均绝对误差分别只有0.07 eV和0.1 eV,与MoSe2/Li2S4的误差几乎相同,但后者是基于3295个数据集。表2显示了基于TL训练的Li2S4、Li2S6、Li2S8的WSe2的数据集和平均绝对误差,其中几乎所有平均绝对误差都接近0.1 eV。FS训练方法获得的平均绝对误差大约是TL方法的两倍。因此,认为这些精确的模型可以用来预测任意构型和随机点位的MoSe2和WSe2上的LiPS结合能。
图7. MoSe2/WSe2对三种多硫化锂的CPU计算时间比较。蓝色球体表示DFT方法的CPU时间消耗,红色三角形表示ML方法的CPU时间消耗。
图7显示了DFT和ML法在6个不同系统上的CPU计算时间的比较,其中所提出的ML法(红色区域)比传统的DFT法(蓝色区域)快6个数量级。值得注意的是,时间比较上只关注单点DFT计算,而实际上DFT优化过程会消耗更多的CPU计算时间。除此之外,DFT法只能处理由几千个原子组成的有限系统,而ML法则不受此限制。总体而言,ML法的计算速度非常快,这对于预测不同点位、任意构型是至关重要的。尽管速度有了很大的提高,但ML法与DFT法的计算精度几乎保持不变。
表3 MoSe2和WSe2与LiPS结合能的统计比较
4. 对ML法预测结果的检验
吸附趋势是检验ML模型可行性和准确性的重要因素。基于ML法,从理论上实现了对任意点位、任意构型的合理预测。预测了图3和图4中讨论的选定结构的结合能,以检验评估吸附趋势的准确性。在图8a(MoSe2对Li2S4)中,结合能的预测结果与DFT结果基本一致,具有相同的吸附趋势,表明所提出的ML模型对结合能的预测是可行和有效的。图8b显示了WSe2对Li2S4的更好的预测结果,其中预测的结合能与DFT计算几乎一致,验证了ML模型的良好预测性能。此外,对图中绘制的其它吸附构型(MoS2对Li2S6、Li2S8,MoSe2对Li2S6、Li2S8)也有较好的预测结果。
图8. DFT计算与ML预测的结合能比较。a, MoSe2对Li2S4;b, WSe2对Li2S4。
为了区分MoSe2和WSe2抑制穿梭效应的结合强度,比较了两种宿主材料对不同LiPS的结合能,如表3所示。为了进行比较,基于训练有素的TL模型,将WSe2-Li2S4、WSe2-Li2S6和WSe2-Li2S8的数据集扩展到与MoSe2-Li2S4、MoSe2-Li2S6和MoSe2-Li2S8相同的大小。表3显示MoSe2对Li2S4结合能的平均值和中位数在-0.18到-0.25 eV之间,小于WSe2对Li2S4的-0.08到-0.15 eV,表明MoSe2在吸附LiPS时比WSe2有更强的结合强度。这些结果表明,所提出的ML模型可以预测二维层状基底材料与LiPS之间的结合能,并极大提高了寻找与MoSe2/WSe2结构相似的最佳基底材料的潜力。
由于ML模型能够预测具有随机点位的任意构型,因此进一步检验了它的准确性和可行性。没有使用任意的构型生成过程,而是手动为LiPS构建了两个构型。如图9a所示,一种构型由两个垂直的Li原子组成,其中最低的Li原子与基底接触,而另一个Li原子远离基底。在第二种构型中,两个Li原子平行于基底并与基底接触。对于这两种构型,还考虑了几种可能的吸附点位。从图9b,c中的红色虚线可以看出,根据下一层中是否有Mo/W原子,有四个可能的点位,包括顶位(在Se原子的顶部)、桥位(在两个Se原子的中心)和两个洞位(在三个Se原子的中心,表示为洞-1和洞-2)。对于垂直Li构型,将最低的Li原子定位在上面讨论的四个点位。对于平行的Li构型,考虑了三种可能的情况,包括两个Se原子的顶部有两个平行的Li原子,一个Se原子上有两个平行的Li原子,以及两个Se原子之间有两个平行的Li原子,分别记为P-1,P-2和P-3位。图10b、11b提供了吸附在MoSe2/WSe2表面上的LiPS的更详细的俯视图。
图9. LiPS的两种构型(Li2S4,Li2S6,Li2S8)和MoSe2/WSe2上的四个吸附点位。a) LiPS的两种构型(垂直和平行)。b-c) MoSe2和WSe2的顶部、桥部、洞1和洞2点位。
对于上述7种可能的吸附情况,构建了40个LiPS基复合物的结构,并用ML法通过改变吸附距离Z在2.0-3.0Å范围内预测了它们的结合能。图10a显示了Li2S4在MoSe2上的结合能随距离Z的变化,距离Z步长为0.025Å。从图10a可以看出,P-2、P-3和洞-1位的最大负结合能分别为-0.78、-0.92和-0.71 eV,对应的距离Z分别为2.975、2.975和2.0Å。图10中P-1、顶、桥和洞-2的结合能随距离Z的增加先减小后增大,这归因于短接触距离时原子排斥力较大,而长接触距离时化学吸附较弱。对于顶位、桥位和洞-2位,在距离Z分别为2.25、2.4和2.225Å时,稳定结合能分别为-0.76、-0.75和-0.70 eV。此外,当距离Z变化较大时,顶位、桥位、洞-1位和洞-2位的结合能波动很小,表明这四个位是Li2S4在MoSe2上相当稳定的吸附位。相反,结合能随P-1、P-2、P-3位的距离Z变化较大,说明当两个Li原子与MoSe2基底接触时,距离的影响更为敏感。然而,这三个点位被赋予了更稳定的结合能,需要更大的距离Z才能保持稳定。特别是在P-1位,最稳定的结合能为-0.99 eV,距离Z为2.85Å。
对于Li2S4吸附在WSe2上的情况,也得到了类似的预测结果(图11a)。当吸附在顶位、桥位、洞-1位和洞-2位时,结合能随距离Z的变化而稳定。这四个点位的稳定结合能分别为-0.75、-0.80、-0.73和-0.75 eV,距离Z分别为2.85、2.4、2.25和2.45;反之,P-1、P-2和P-3位的结合能随距离Z变化很大,较稳定的结合能分别为-0.9、-0.81和-0.94eV,距离Z分别为2.825、2.975和2.925Å。这证明了我们的ML模型对于寻找更稳定的吸附结构是有效的。
图10. a) ML预测Li2S4在MoSe2上的结合能与距离Z的曲线图,在不同的吸附点位有两种构型,其中距离Z是最低Li原子与MoSe2之间的距离,范围为2.0-3.0 Å;b) Li2S4在MoSe2上的俯视图,在不同的吸附点位有两种构型。
图11. a) ML预测了Li2S4在WSe2上的结合能与距离Z的曲线图,在不同的吸附点位有两种构型,其中距离Z是最低的Li原子与WSe2之间的距离,范围为2.0-3.0 Å;b) Li2S4在WSe2上的俯视图,在不同的吸附点位有两种构型。
【结论】
作者提出了一种ML方法来快速准确地预测锂硫电池体系中宿主材料与LiPS的结合能。以MoSe2和WSe2为宿主材料,选择Li2S4、Li2S6和Li2S8为典型的可溶性LiPS。基于对任意吸附构型和随机点位的单点计算,生成了数千个数据作为ML训练的数据集。该方法的预测精度与DFT方法相同,预测MAE为0.1 eV。为了进一步减少计算时间,应用TL法预测了WSe2与LiPS的结合能,只用了七分之一的数据集,这大大减少了传统DFT计算所需的时间。从预测精度和时间消耗两个方面来看,所提出的ML模型都取得了很好的效果。此外,该方法还实现了对任意吸附构型和点位的快速预测,该模型有望进一步应用于筛选和发现其他类似MoS2结构的二维(2D) AB2型层状化合物作为锂硫电池宿主材料以及其他涉及分子吸附的领域。这项工作为分子吸附在新兴储能材料及其电池系统领域的潜在应用打开了大门。
Haikuo Zhang, Zhilong Wang, Jiahao Ren, Jinyun Liu, Jinjin Li, Ultra-fast and accurate binding energy prediction of shuttle effect-suppressive sulfur hosts for lithium-sulfur batteries using machine learning. Energy Storage Materials 2021, DOI:10.1016/j.ensm.2020.11.009
以上是关于比DFT快6个数量级!机器学习超快准确预测宿主材料对多硫化锂的吸附机理的主要内容,如果未能解决你的问题,请参考以下文章