【计算+机器学习】JEC:基于集成学习分类器发现杂原子掺杂砷烯析氢反应的催化剂

【计算+机器学习】JEC:基于集成学习分类器发现杂原子掺杂砷烯析氢反应的催化剂
成果简介
近年来,二维(2D)材料对析氢反应(HER)表现出良好的催化活性。同时,金属和非金属原子被用于2D材料催化剂的改性,提高了催化效率。2D材料中,砷烯在光电催化等领域表现出良好的催化性能。因此,砷烯适合作为二维基底材料,能够获得更好的HER催化性能。但考虑到材料体系可能有多种调控方式,会形成一个包含数千种新材料的大空间。为了解决这一问题,目前研究人员开始建立定量的结构-活性关系,以克服传统高通量计算效率低的问题,从而推动材料信息学的进步。因此,上海交通大学李金金等人采用SMOTE开发了一种新的高效集成学习分类器,用于杂原子掺杂砷烯HER催化剂。作者共收集了850种掺杂的砷烯作为数据集,机器学习预测准确率为81%。基于预测结果,作者提出了13种低成本且易于合成的二维Fe掺杂的砷烯催化材料。本文的方法可以在少量数据时,实现高预测精度,使预测的速度加快数百万倍,并能够筛选高效催化剂,同时也可以扩展到预测其他可精细调控的二维催化剂。
计算及机器学习方法
计算方法:本文通过VASP软件进行DFT的第一性原理计算。DFT用于计算模型的电子和能量,Perdew-Burke-Ernzerhof(PBE)的广义梯度近似(GGA)用于描述电子之间的交换-相关能。对于平面波基组截断能设置为450eV,布里渊区k点网格采用4×5×1 。考虑到过渡金属的强电子相关性,参考前人的工作,本文使用具有U-J参数的DFT+U。在垂直方向上设置15Å的真空空间,以防止相邻层之间的相互作用,并确保保持单一的2D结构。
SMOTE:在不平衡数据的过程中,执行的一种过采样策略,增加初始数据集中的数量。在本研究中,SMOTE算法是用imbleach python库实现的,用于构建合成样本的最近邻居数量设置为5。
机器学习GBDT算法:是一种用于回归和分类任务的机器学习技术。梯度增强算法有三个主要组成部分:损失函数、弱学习器和加性模型。在本文工作中,GBDT算法的训练是在scikit学习python库的框架内进行的,包括数据预处理,ROC曲线计算和混淆矩阵绘制。
图文导读
基于杂原子掺杂剂、选定的过渡金属元素和非金属元素,建立了一个包含所有潜在HER催化剂的通用化学式,其化学式为Xn-M(杂原子掺杂的砷烯材料),如图1(a)所示。如图1(b)所示,选择砷烯结构的四个位点来进行杂原子的掺杂,其中包括一个过渡金属掺杂剂和三个非金属原子。砷烯的侧视图清楚地显示了它的双原子层结构。位点1原子和位点2,3,4原子分别位于不同的层中。
在这项工作中,位置1中的杂原子是过渡金属(TM)原子,位置2、3、4中的原子是非金属(NM)原子,共有25种过渡金属元素被选择用于位点1。如图1(c)所示,本文从850种改性的砷烯材料中随机选择了126种材料,并基于DFT计算了它们的氢吸附能。吉布斯自由能是评估催化活性的方法,本文以吉布斯自由能变化(ΔGH)为分类目标,筛选出|ΔGH|<0.2eV的材料,并预测了140种具有不同掺杂原子和掺杂位点的改性砷烯材料作为HER有前途的候选催化剂,ML预测准确率为81%。
【计算+机器学习】JEC:基于集成学习分类器发现杂原子掺杂砷烯析氢反应的催化剂
图1(a)用于结构方面的过渡金属和非金属元素的组合;(b) 改性砷烯的俯视图和侧视图;(c) 筛选性能优异的HER催化剂流程图
本文将随机选择126个杂原子掺杂的砷烯材料构建ML数据库,其中包含10种过渡金属元素和13种非金属共掺杂对。基于DFT计算,得到以上体系的电子结构和HER活性,并用形成能(Ef)来评价体系的稳定性,其中大多数模型显示出负的形成能,证明这些材料是稳定的。HER是最简单的电化学反应,也是多电子转移的电化学反应基本过程。然而,完整的HER涉及多个过程,并且反应途径根据电极的性质而不同。根据Sabatier原理,催化剂的H吸附强度和H2解离强度之间需要平衡,这说明这种平衡应该允许催化剂强烈地吸附H,但不能太强。热力学特征ΔGH用于表征HER催化剂的活性性能,理想催化剂的ΔGH接近0eV。从126个选择的杂原子掺杂砷烯中,计算出38个Xn-M是|ΔGH|<0.2eV的理想催化剂,其中16个设计的催化剂表现出|ΔGH|<0.1eV,22个表现出|ΔGH|在0.1-0.2eV之间,如表1所示。
表1 杂原子掺杂砷烯HER催化性能的吉布斯自由能变化(ΔGH),其中38个结构显示出优异的催化性能(|ΔGH|<0.2eV)。
【计算+机器学习】JEC:基于集成学习分类器发现杂原子掺杂砷烯析氢反应的催化剂
图2显示了Xn-M的计算能垒图。根据d轨道的占有情况,本工作中使用的过渡金属分为三类:3d、4d和5d金属。在具有3d金属(Sc、Ti、V、Mn、Fe和Ni)的Xn-M中,大多数Xn-Fe型模型具有满足要求的良好HER性能(|ΔGH|<0.2eV),对于4d金属(Ru和Rh),具有Cn非金属配位环境(C1、C2和C3)的模型显示出接近0eV的理想ΔGH,含有5d金属(Os和Ir)的模型表现出对H原子的吸附过于强烈的趋势,将影响后续的H2释放。
【计算+机器学习】JEC:基于集成学习分类器发现杂原子掺杂砷烯析氢反应的催化剂
图2 Xn-Ms能垒图的计算
图3进一步显示了不同非金属配位环境对所有模型中HER催化活性的影响比较。如图3(a)所示,具有C掺杂的非金属配位环境的13个系统表现出良好的HER活性,并且C原子数量的增加对HER活性的影响较弱。对于图中的Nx-M,如图3(b)所示,只有五个系统显示|ΔGH|接近0 eV。对于Nx-Fe系统,当N原子数增加到3个时,HER催化性能增强。图3(c)中四个Ox-M体系具有良好的HER催化活性,并且随着O原子数的增加,H原子对活性位点的吸附逐渐减少。在S掺杂体系中,S1-V表现出最好的HER催化活性。图3(d)显示了由多种非金属共掺杂的模型,当C和N一起形成非金属配位环境时,活性位点对H的吸附变得更强。N1O1非金属配位促进了含Sc和V体系对H的吸附,使N1O1-Sc体系的|ΔGH|接近0eV。当N和S共掺杂时,N1S1-Ru、N1S1-Rh和N1S1-Sc对H原子的吸附增强,而H原子对其他体系的吸附减弱。此外,进一步讨论了候选催化剂的电子结构,对良好的催化活性作出了解释。
【计算+机器学习】JEC:基于集成学习分类器发现杂原子掺杂砷烯析氢反应的催化剂
图3 Xn-Ms在不同非金属配位环境下的能量比较
根据如图4(a)数据可以看出性能优异的模型数量相对于总数太少,导致初始数据集中的目标观测值分布不均匀。图4(b)显示了126种掺杂砷烯材料ΔGH变化的散点图,最大值为1.38eV,最小值为-1.09eV。本文将0.2eV的绝对值设置为阈值,将原始数据分为两类。在所有126种掺杂的砷烯材料中,样本量的不平衡限制了ML模型的预测性能,为了解决原始数据集中数据分布不均匀的问题,作者采用了少数过采样技术(SMOTE)来实现数据增强,并获得|ΔGH|<0.2eV和|ΔGH|>0.2eV之间的平衡数据分布。如图4(c)所示,SMOTE处理后的两类的数量呈现均匀分布。
【计算+机器学习】JEC:基于集成学习分类器发现杂原子掺杂砷烯析氢反应的催化剂
图4 (a)126个原始数据中的两类数据数量,包括38个|ΔGH|<0.2eV的结构和88个|ΔGH |>0.2eV的结构(b)通过DFT计算获得的126种掺杂砷烯材料的ΔGH的散点图,阴影区域中的数据点表示具有良好催化活性的材料(c) 用SMOTE算法处理数据后的两个类的数量,包括88个|ΔGH|<0.2eV的结构和88个|ΔGH|>0.2eV的构造
本文选用了120个元素属性,并使用Matminer工具生成用于模型训练的特征。随后选用逻辑回归(LR)、支持向量机(SVM)、决策树(DT)和梯度增强决策树(GBDT)进行机器学习模型预测,并对这4个ML模型进行了5倍的交叉验证,比较了它们的准确性。四个模型的ROC曲线如图5(a)所示。显然,图5(a)中的蓝色曲线对应的区域更大,表明GBDT模型在测试数据中具有更高的精度。四个模型在CV过程中每一次交叉验证的性能如图5(b)所示。四个模型的平均精度值分别为0.81(GBDT)、0.73(DT)、0.54(SVM)和0.65(LR)。此外,四个模型的混淆矩阵如图所示5(c)所示,根据对比分析,混淆矩阵进一步证明GBDT模型的性能更优异。根据这一比较,选择GBDT作为ML模型来进行改性砷烯的分类,其预测准确率为81%。基于GBDT模型,作者将剩余的724种潜在催化剂分为两类,其中140种新的砷烯材料被预测对HER具有良好的催化活性。
【计算+机器学习】JEC:基于集成学习分类器发现杂原子掺杂砷烯析氢反应的催化剂
图5 (a)梯度增强决策树(GBDT)、决策树(DT)、支持向量机(SVM)和逻辑回归(LR)的ROC曲线和AUC的对应值(b) GBDT的五倍交叉验证结果,平均准确度为0.81(c) 四种不同模型的混淆矩阵,其中(0,0)、(1,0)、(0,1)和(1,1)中的数据是真正(TP)样本、假负(FN)样本、伪正(FP)样本和真负(TN)样本的数量
为了选择应用更广泛的砷烯材料,需要考虑掺杂金属元素的毒性、放射性和成本。因此,作者去除了昂贵、稀缺或有毒金属,留下99个元素。随后筛选了21个Xn-Ms表现出优异的催化活性(|ΔGH|<0.2eV),其中大部分是含Fe原子的模型。由于在实验催化研究中,成功合成了具有Fe原子的材料,并证明其具有高催化活性。选择了13种|ΔGH|低于0.2eV的Fe掺杂砷烯材料作为易于制备、低成本和高活性的催化剂,ΔGH的值如图6所示。在这13种的材料中,CNO-Fe改性的砷烯表现出最低的|ΔGH|,为0.009eV,S3-Fe改性的砷烯显示出最高的ΔGH,为0.195eV。这13种材料有望成为实验合成和实际应用中最有前途的2D砷烯催化剂材料。
【计算+机器学习】JEC:基于集成学习分类器发现杂原子掺杂砷烯析氢反应的催化剂
图6 Fe掺杂砷烯及其相应的ΔGH,其中CNO-Fe改性砷烯表现出最低的|ΔGH|,而S3-Fe改性砷烯表现出最高的|ΔGH|
结论与展望
本文以单个过渡金属和三个非金属杂原子掺杂2D砷烯材料为例,介绍了一种通过机器学模型从元素周期表中选择高性能催化剂的方法,并证明了所提出的SMOTE算法可以处理材料数据不平衡的问题,并应用GBDT算法对整个材料空间进行分类,最终筛选出140种有前途的HER催化剂,并结合DFT计算做出进一步验证,为其他复杂材料的机器学习预测奠定了基础。
文献信息
Chen A, Cai J, Wang Z, et al. An ensemble learning classifier to discover arsenene catalysts with implanted heteroatoms for hydrogen evolution reaction[J]. Journal of Energy Chemistry, 2023, 78: 268-276.
https://doi.org/10.1016/j.jechem.2022.11.035

原创文章,作者:计算搬砖工程师,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2024/01/15/1e991d69be/

(0)

相关推荐