【纯计算】J. Colloid Interf. Sci.：双电子氧还原反应中高性能单原子电催化剂的机器学习筛选

研究背景

电催化因其简单、方便、环境友好，已成为高能耗和污染的传统蒽醌制备过氧化氢的最有前途的替代品之一。然而，氧还原反应（ORR）通过2e^–路径生成过氧化氢是4e^–ORR生成水的竞争途径。因此，鉴定一种具有2e^–ORR高选择性和活性的电催化剂至关重要。太原理工大学刘吉明和简选等人收集了149种单原子催化剂(SACs)的O*吸附自由能(ΔG (O*))，利用文献中的密度泛函理论(DFT)计算31种SACs的极限电势(U_L)，建立了5种机器学习(ML)模型。证实ML的预测高选择性、高活性电催化剂材料性能的方法为发现和设计更有价值的SACs催化剂提供了一种高效、快速、低成本的方法。

计算方法

理论计算：自旋极化DFT计算使用VASP代码进行，平面波截止能量设置为400 eV。通过投影仪增广波（PAW）方法，利用广义梯度近似（GGA）中的PBE泛函来计算电子交换-相关相互作用，使用Monkhorst-Pack k点网格设置为3×3×1，对所有DFT计算进行采样。真空空间在二维层的垂直方向上设置为至少15Å，以消除原子周期图像之间的人工相互作用。将原子的最大力设置为0.02 eV/ Å，自洽场总能量收敛准则设置为10^-5eV。

机器学习：使用了五种算法对模型进行训练：随机森林（RF）、梯度增强决策树（GBDT）、线性回归（LR）、神经网络（NN）和k-最近邻（KNN）。评价标准为均方误差(MSE)和决定系数(R²)。通过对训练结果进行评分，确定通过射频训练得到的模型为最佳模型。我们对RF的各种超参数进行网格搜索和交叉验证，在避免过拟合的情况下获得最佳参数。利用RF和树数预测无吸附能(ΔG (O*))的模型的最大深度设为80。其他使用RF的必要参数设置如下：预测ΔG (O*)的模型步长和最大深度分别为0.1和7；最大迭代次数为100次；次抽样比为0.7；理论极限电位(U_L)模型最大深度为80；树数为250。将数据集分为训练集和验证集进行数据预处理。根据训练和测试分数，将用于预测ΔG (O*)和U_L的模型的测试集比率分别设置为0.8和0.9。用ML选择具有高选择性和高活性的SACs，用DFT计算筛选出的两种材料的活性，以确定ML的适用性。

结果与分析

本研究选择了7种（类似）石墨烯支撑结构：(1)单缺陷石墨烯（M@C₃）、双缺陷石墨烯（M@C₄）；(2)氮化硼（BN）单层（M@B-N₃）；(3)四种二维共价有机结构，包括酞菁-N₄（M@Pc-N₄）、卟啉-N₄（M@Py-N₄）、卟啉-N₄（M@Pr-N₄）和M@Pd-N₄），以及来自其他23种配合环境的支撑结构，包括M@NxCy（x+y=3）、M@NxCy、M@Pc-NxCy、M@Py-NxCy、M@Pr-NxCy、M@Pd-NxCy（x+y=4），如图1所示。采用4个主要族金属元素和26个过渡金属元素作为中心金属原子（图2f)。由此得到839个SACs，其中149个催化性能已知的SACs用于训练模型，而690个催化性能未知的SACs的选择性和活性使用ML模型进行预测。

图1 催化剂结构示意图

筛选策略分为三个步骤（图2）：(i)通过数据预处理和滤波等特征工程，选择能够准确描述SACs的ΔG (O*)及其U_L的2e^–ORR描述符；(ii)使用5种ML算法分别训练目标值为ΔG (O*)和U_L的样本。然后根据训练结果的R²和MSE得到两个最佳预测模型(模型A和模型B)；(iii)将690种待预测SACs分别输入模型A和模型B，对其选择性和活性指标进行筛选，得到2e^–ORR产H₂O₂的高性能电催化剂。

图2 机器学习工作流

作者的目标是通过2e^–ORR途径生成H₂O₂，防止O₂通过解离或4e^–ORR途径生成H₂O。知道O₂可以通过三种方式吸附在金属表面：Pauling、Griffiths和Yeager型。在鲍林型中，一个活性位点只被O₂的一个O原子占据。因此又称头接头，对保持O-O键很有帮助。如果O₂只能以Pauling的形式吸附在SACs上，则不会形成解离。因此，在O₂分子与H⁺配对得到OOH*后，反应只能通过两种途径继续进行：(a) OOH* + H⁺/e⁻→H₂O₂或(b) OOH* + H⁺/e⁻→O* + H₂O。OOH*对H₂O₂形成势要小于OOH*加氢生成O*吸附质的形成势，从而证实了SACs在热力学上有利于OOH*通过途径a生成H₂O₂。因此，要获得高选择性的2e^–ORR SACs，ΔG (O*)需要大于(ΔG (H₂O₂)−ΔG (H₂O))。即ΔG (O*)>3.52 eV。因此，定义了ΔG (O*) >3.52 eV作为筛选高选择性SACs的标准，使用149个SACs中已知的ΔG (O*)作为训练模型数据集的目标值。

根据SACs的具体结构（表S1)，选择了10个特征描述符：氧化形成焓（H_f,_ox）、调整后的d/p轨道（V_M）、半径(R)、第一电离能（I_m）、电子亲和性（A_m）、电负性（N_m）、金属原子配位数（N_n）、中心金属原子与N/C原子的总和（SN_m）、金属原子及其配位原子中心价电子之和（SV）和单位基分子量（M_r）。前六个描述符描述了中心金属原子本身的固有特性，第七到第九个描述符描述了金属原子的配位环境，最后一个描述符表达了衬底的性质。通过这十个描述符，可以深入总结SACs催化剂的催化性能与物理性质之间的关系。

使用五种ML算法进行模型训练，并对不同的超参数进行网格搜索和交叉验证(视觉模型和性能见图4a、4b和S1)。使用LR、KNN和ANN算法训练的模型对目标值的预测性能明显低于使用RF和GBDT算法训练的模型。此外，使用RF和GBDT训练的ML模型的预测数据与之前输入的目标值一致，表明ML模型的性能优越。这种性能可能是由于以下原因：(1)KNN算法需要一个相对一致的特征空间：(2)线性回归算法不能很好地拟合非线性与特征相关的数据，容易出现过拟合：(3)与其他算法相比，人工神经网络算法需要更广泛的数据集。相比之下，本工作中的数据集较小，这可能导致学习不足，容易陷入局部极值。比较了RF和GBDT训练模型的特征重要性(图4c)。尽管RF和GBDT模型的每个特征的基本值不同，但其相对重要性的评估描述符是一致的。前三位描述符分别是V_M (RF为0.327,GBDT为0.439)、H_f,ox(0.372, 0.248)和SV(0.153, 0.377)。这一结果可以用理论评价来解释：(1)VM反映了原子提供或接收电子的能力；(2) H_f,ox表明氧容易与金属原子发生反应。中心金属原子的I_m(0.04和0.06)和与中心金属原子及其相邻环相连的N/C原子的SN_m(0.05和0.04)也相当重要，因为电离能代表原子失去电子的能力，其电负性受其外部环境和内部性质的影响。当一个原子或取代基具有较高的电负性时，它更有可能把电子吸引到自己身上。因此，中心金属原子的固有特性及其配位环境对于准确描述机器学习应用中SACs的性能至关重要。

然后，使用最佳的RF训练模型来预测690个催化性能未知的SACs的ΔG（O*）值（表S1）。筛选出97个△G（O*）预测值大于3.52 eV的SACs，表明这些SACs具有较高的选择性。

图3 通过DFT计算了O*在SACs表面上的Gibbs吸附自由能与(a)随机森林模型和(b)梯度提升模型的预测结果。(c)RF和GBDT模型之间特征重要性的比较。

除了高选择性外，一种很有前途的2e^–ORR SACs电催化剂的U_L应该接近0.7 V_SHE。我们使用贵金属催化剂PdHg₄作为SACs活性标准（U_L = 0.46 V）。因此，本部分目的是筛选出UL >为0.46 V的优秀SACs。

选择31个SACs的已知U_L值作为模型训练数据集的目标值，并使用6个特征描述符（V_M、H_f,ox、A_m、I_m、SN_m和SV）。再次使用了前五种ML算法来训练这个模型。KNN、ANN、LR和GBDT算法训练的模型测试集的MSE值分别为0.015、5.039、0.012和0.008(图S2)，而RF算法训练的模型的MSE值仅为0.002(图4a)，说明RF在预测U_L方面是一个相当可靠的模型。图4b描述了特征重要性的比较。其中H_f,ox(0.397)、SN_m(0.298)和I_m(0.109)是重要的描述符，表明中心金属原子的固有性质及其配位环境对于准确描述SACs的催化性能至关重要。

图4 U_L的算法预测结果

使用该模型预测了97个选定SACs的U_L(表S4)，最终获得了4个具有UL>0.46 V，分别为Zn@Pc-N₃C₁(0.48)、Au@Pd-N₄(0.50)、Au@Pd-N₁C₃(0.48)、Au@Py-N₃C₁(0.48)。根据Sabatier原理，当OOH* 的吉布斯自由能(ΔG (OOH*))值过高或过低时，催化材料不能通过2e^–ORR生成H₂O₂。图6显示了97个SACs的ΔG (OOH*)值与ML模型预测的U_L (ΔG (OOH*)值之间的火山关系。Zn@Pc-N₃C₁、Au@Pd-N₄、Au@Pd-N₁C₃、Au@Py-N₃C₁的U_L值更接近火山峰值，说明它们比贵金属催化剂PtHg₄具有更强的ORR活性，更容易选择性生成H₂O₂。此外，以Zn、Au和Ag为中心金属原子的SACs的U_L值比以其他中心金属原子为中心的催化剂更接近火山峰。因此，Zn、Au和Ag是2e^–ORR的重要活性位点。

图5 用ML模型预测数据绘制的97个SACs的ΔG（OOH*）与U_L之间的火山关系

此外，作者比较了含氧物质(O*， OOH*)在标准金属表面和研究的SACs上的吸附能差异。一般来说，金属表面的O*和OOH*分别倾向于在中空和顶部位置吸附，而SACs由于其独特的结构，只能在顶部位置提供吸附位点。因此，SACs表面更有利于OOH*的吸附，而O*在其表面的吸附极不稳定。由图6可知，在金属表面ΔG (OOH*)与ΔG (O*)呈线性相关关系。这种线性相关性意味着选择性的增加导致活性的降低。在所筛选的97个SACs表面，当ΔG (O*)值大于3.52 eV时，ΔG (OOH*)不增加，从而打破了金属表面含氧物质之间的线性关系，这是SACs能够同时满足高选择性和高活性的重要原因。

值得注意的是，如果使用vasp软件和40核超级计算机的催化性能计算基于第一原理，平均需要36.125 CPU-h才能得到理想的结果，即在单核处理器上约1445 CPU-h。但是，如果基于ML来预测催化性能，那么在单核处理器上进行模型训练和预测只需要10秒左右。因此，基于ML的SACs的吸附性能和催化活性预测比基于DFT的预测速度快约50万倍。这一发现表明，ML可以显著降低计算成本，并成为识别高性能SAC的重要策略。

图6 研究了97个SACs与金属表面之间的ΔG（O*）和ΔG（OOH*）的关系，以及其活性和选择性的变化趋势。灰色虚线表示ΔG (OOH*)与ΔG (O*)在金属表面的变化趋势，红色虚线对2e^–ORR和4e^–ORR具有高选择性的SACs进行分离，黑色虚线附近的区域表示SACs的高活性区域。

结论与展望

与以往的研究相比，作者的研究使用ML发现了2e^–ORR的电催化剂，扩大了SACs的筛选范围，并系统地比较了不同的ML算法，利用ML模型预测ΔG (O*)和UL，筛选出4种高选择性和高活性的电催化剂。随后，通过DFT计算验证，证实ML非常有效且适合筛选SACs，具有高选择性和高活性。该策略为设计有前途的H₂O₂ – 2^e-ORR电催化剂提供了一种低成本的思路，有望成为设计和筛选电催化剂的通用策略。此外，将电催化剂推向火山山顶仍然是一个相当大的挑战。

文献信息

Zhang, X., Liu, J., Li, R., Jian, X., Gao, X., Lu, Z., & Yue, X. (2023). Machine Learning Screening of High-performance Single-atom Electrocatalysts for Two-electron Oxygen Reduction Reaction. Journal of Colloid and Interface Science.

原创文章，作者：计算搬砖工程师，如若转载，请注明来源华算科技，注明出处：https://www.v-suan.com/index.php/2024/03/12/73fdd19e54/

【纯计算】J. Colloid Interf. Sci.：双电子氧还原反应中高性能单原子电催化剂的机器学习筛选

相关推荐

分享到：