CEJ:采用迭代机器学习方法筛选高性能H2O2生产催化剂

CEJ:采用迭代机器学习方法筛选高性能H2O2生产催化剂
研究背景
过氧化氢(H2O2)作为一种重要的原料,已被广泛应用于纺织、食品、废水处理和造纸等领域。尽管H2O2代表一种绿色氧化剂,但传统的生产工艺根本不是绿色的。目前,H2O2的工业生产在很大程度上依赖于蒽醌氧化工艺,这是一种能源密集型和环境污染型的工艺,会导致环境问题。电化学H2O2生产是未经验证取代蒽醌循环工艺的一种非常理想的方法。在催化剂的帮助下,一种先进的双电子氧还原反应(ORR)的电化学方法可以由清洁的反应物(O2,H+)进行,其主要产物是H2O2。然而,设计和开发绿色、低成本和高效的电催化剂仍然是一个挑战。
因此,广西大学危增曦和赵双良等人提出了一种迭代机器学习(iML)方法,该方法大大减少了所需的训练集大小,如图1。通过引入空间坐标信息的特征,可以从数百种单原子催化剂中快速筛选出最佳催化活性。发现RhO2N2(A)是H2O2生产的理想催化剂,具有0.013V的超低过电位。这项工作为加快数据驱动的高性能催化剂的设计和发现开辟了道路。
CEJ:采用迭代机器学习方法筛选高性能H2O2生产催化剂
图1. iML方法方案
计算与机器学习方法
DFT计算方法:所有计算均采用自旋极化密度泛函理论(DFT)方法进行,并采用维也纳从头算模拟软件包(VASP)在广义梯度近似(GGA)-Perdew-Burke-Ernzerhof(PBE)水平上进行催化剂电子结构计算,施加投影增强波PAW泛函计算电子-离子的相互作用。平面波截止被设置为500eV。电子会聚能量被设置为10-6 eV,并且所有原子位置都被允许弛豫,直到力小于0.02eV/Å。布里渊区由Monkhorst 2×2×1 k点网格组成。为了避免两个相邻的周期性几何图像之间的相互作用,真空度设置为15Å来消除对称性的影响,同时采用DFT-D3方案来校正范德华相互作用。
机器学习方法:本文将线性模型和非线性模型都被考虑在内。为了预测回归数据,通过线性/非线性模型考虑了50%的交叉验证。采用网格搜索对模型进行超参数筛选。所有算法都使用Python软件包Scikit-Learn进行了评估和优化。
结果与讨论
本文选择了17种不同的物理和化学性质(1)d和p轨道的电子数(Edp);(2)氧化物生成焓(Hfox),(3)电负性(Nm);(4)电子亲和能(Am);(5)第一电离能(Im);(6)原子序数(An);(7)原子半径(R);(8) 价电子数(Ve);(9)筛选百分比(Scpe);(10)共价半径(Ccr);(11)配位环境原子半径之和(SR);(12)配位环境的原子质量总和(SRam);(13)配位环境的原子序数之和(SAn);(14)配位环境的电子亲和能之和(SAm);(15)配位环境的电负性之和(SNm);(16)配位环境的价电子之和(SVe);(17)配位环境的质子亲和能之和(SEpa),这些描述符特征都是从数据库、元素周期表和公开文献信息中得到的。
特征选择的包装法以基本模型训练为机器学习模型,以性能评价指标为特征选择的重要依据。因此,随机森林(非线性模型)和支持向量机(线性模型)被采用。如图6a所示,当维度达到17,随机森林模型稳定。SVM模型在维度超过5时保持其性能,但随后在维度超过20时迅速下降。为了进一步确定特征的重要性,使用了嵌入方法LASSO,将特征选择过程与模型训练过程相结合。如图2b所示,结果表明在这些候选者中,六个电子结构特征占主导地位,包括NmRHfoxImEdpAm。此外,NmR是H2O2产生的两个重要特征。特征相关性通过Pearson系数进行研究,该方法通过评估每个特征与结果之间的相关性来实现。如图6c,各种特征与△G*OOH之间的相关系数,在特征选择方法中,TM的电负性和原子半径都是双电子ORR催化活性的主要催化活性描述符。
CEJ:采用迭代机器学习方法筛选高性能H2O2生产催化剂
图2.(a)通过随机森林算法和线性回归算法测试了特征数量方面的性能;(b) 14个特征的特征重要性;(c)过渡金属的10个输入特征和配位原子的7个输入特征之间的Pearson相关图,E表示△G*OOH
20个不同的过渡金属原子和六种构型(TMN4、TM-N3O、TM-N2O2(A)、TM-N2O3(B)、TM-NO3和TM-O4)构建了120种可能的组合。通常,配位原子的电负性相加作为活性预测的描述符。然而,配位原子的几何差异被忽略。为了揭示几何差异,本文首先提出了SACs的空间(三维坐标)特征。如图3所示,中心金属的坐标和配位原子被考虑在内,并采用映射函数方式进行了降维。
CEJ:采用迭代机器学习方法筛选高性能H2O2生产催化剂
图3. 将单原子催化剂的空间坐标信息简化为数字特征,以区分结构的多样性。具有空间信息的特征由空间信息权重和配位原子的固有特征定义以及过渡金属的PTM的空间信息权重
在特征工程之后,本文进一步选择合适的模型进行数据集训练。在iML过程中,每批Bi都可以通过交叉验证方法进行有效训练。本文将数据集的一部分用于测试,其他四部分用于训练(图4a)。如图4b所示,共测试了13个模型。仅在第四次迭代中的四次测试结果表明,BayesianRidge、RandomForest、MLP和XGBoost,有较低的MAE和MSE,表现出良好的性能。MLP和XGBoost模型都可以用于训练我们的数据集,因为它们具有高效的可扩展性和强大的鲁棒性。然而,在没有空间坐标信息的情况下,XGBoost和MLP模型对H2O2产生的预测性能较差。通过空间坐标信息,XGBoost(s)模型表明,数据集训练的MAE和MSE得分分别为0.494eV和0.434eV。此外,MLP(s)模型在预测H2O2活性方面表现出优异的性能。
为了在MLP模型中提高模型的泛化性能,考虑Dropout调优。激活函数和优化器分别设置为tanh和SGD。最后,在输出中可以获得70个神经元。
CEJ:采用迭代机器学习方法筛选高性能H2O2生产催化剂
图4.(a)五折的交叉验证模型;(b)对13个机器学习模型的平均绝对误差和均方误差进行了交叉验证测试;(c)第三次迭代机器学习过程后机器学习模型(即XGBoost、XGBoost(s)、MLP和MLP(s))的R2得分、平均绝对误差和均方误差。XGBoost(s)和MLP(s)表示在XGBoost和MLP中引入空间坐标信息的特征,吸附自由能约为4.22eV的输入数据可以通过第三次迭代机器学习过程识别
利用iML过程,预测了的吸附自由能。结果表明,在第三次迭代过程中可以找到最佳催化剂,如图5a。RhN2O2A模型表现出4.233eV的最佳*OOH吸附自由能,表明其产生H2O2的超低过电势为0.013V。其次是NiN2O2B,其*OOH吸附自由能为4.116eV。但NiN3O构型表现出4.380eV的弱*OOH吸收能,其中Ni的中心原子分别由一个氧原子和三个氮原子配位。此外,对于H2O2的产生,CoN3O构型表现出4.115eV的*OOH吸附自由能。
CEJ:采用迭代机器学习方法筛选高性能H2O2生产催化剂
图5.(a) 4.22eV附近的吸附自由能可以通过第三个迭代机器学习过程来识别。表现出用于H2O2生产的合适*OOH吸附自由能,包括RhN2O2A(4.233eV)、NiN2O2B(4.116eV)、CoN3O(4.115eV)和NiN3O(4.422eV);(b)*OOH在各种SACs上的中间吸附自由能
此外,*OOH中间体在各种SACs上的吸附自由能是通过DFT计算确定的,如图5b所示。在H2O2生产中,虚线代表理想△G*OOH=4.22eV。
事实上,在过去几十年中,双电子ORR途径一直被视为四电子ORR过程在燃料电池应用中的副反应。因此,SACs上的双电子ORR选择性可以作为筛选用于H2O2生产的高效催化剂的标准。如图6所示,两个电子的ORR活性和四个电子的ORR活性都被绘制为*OOH吸附自由能的函数。两电子ORR在SACs上的过电位小于四电子ORR的过电位,这表明ORR过程对H2O2的产生具有优势。
CEJ:采用迭代机器学习方法筛选高性能H2O2生产催化剂
图6. 作为*OOH吸附自由能函数的两电子和四电子氧还原反应的理论火山图
结论与展望
本文提出了一种iML方法来快速筛选用于H2O2生产的目标催化剂,在机器学习过程中,可以通过空间坐标特征来区分SACs中复杂的协调环境。在新的迭代机器学习方法中采用了多层神经网络,并在第三次迭代过程中识别了理想催化剂RhN2O2A。此外,RhN2O2A在0.013V的超低过电位下表现出最佳的H2O2生产活性,本工作将有助于筛选工业系统中用于H2O2生产的新型催化剂。
文献信息
Deng B, Chen P, Xie P, et al. Iterative machine learning method for screening high-performance catalysts for H2O2 production[J]. Chemical Engineering Science, 2023, 267: 118368.
https://doi.org/10.1016/j.ces.2022.118368

原创文章,作者:计算搬砖工程师,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2024/02/07/6ec83a4771/

(0)

相关推荐