【CP2K+机器学习】纯计算-JACS:基于光谱描述符由AI生成催化结构

【CP2K+机器学习】纯计算-JACS:基于光谱描述符由AI生成催化结构

成果简介
传统的化学描述符通常是离散或不连续的,这限制了催化过程中不同状态结构的批量设计,只能实现一些特殊状态的设计。为了解决这个问题,中国科学技术大学江俊、王嵩、黄炎等人利用基于光谱描述符的机器学模型,为金属单原子催化剂上吸附的分子建立了定量的光谱结构-性质关系。由于光谱描述符的连续可调性,他们实现了AI生成催化过程连续吸附态的设计,该项工作为利用光谱技术实现催化过程的实时监测和催化性能持续性预测铺平了道路。

模型与计算方法

分子动力学模拟过程中,在CP2K软件包中采用混合高斯平面波(GPW)30方法,截断能设置为500 Ry,并使用GTH赝势来描述其他的核心电子,还使用PBE泛函和Grimme-D3来分别考虑交换相关效应和范德华相互作用,在所有计算模拟中,均采用了局部双ζ极化(DZVP)基组来描述波函数。静态计算中作者使用VASP软件包中广义梯度近似(GGA)下的PBE泛函描述相互关联能,体系的平面波截断能设为400 eV,k点选取3×3×1网格格点,自洽计算要求体系总能量收敛公差小于10−5eV。同时作者使用PAW来处理离子-电子相互作用,对于吸附分子与表面的范德华相互作用通过DFT-D3方法进行修正,作者沿着z方向设置了15Å的真空层,以避免周期性相互作用。红外光谱由Gaussian 16软件包利用PBE泛函和6-31+G**基组计算得出,针对催化体系中的过渡金属元素施加LANL2DZ基组来使计算更为精确。

神经网络架构中使用具有一个输入层(包含红外光谱、铜原子数和二氧化钛原子数三个神经元)、五个隐藏层(每个隐藏层由1024个神经元组成,80%的数据集用于训练,20%的数据集用于验证)和一个输出层(吸附状态的预测值)。而迁移学习是先冻结神经网络的后四个隐藏层,只训练输出层,然后解冻所有层,继续训练神经网络。
结果与讨论
作者以单原子催化剂(SAC)为例,研究了二氧化碳还原反应(CO2RR)过程中中间体CO的吸附状态与光谱特征之间的定量关系,建立了一个ML模型(ML-1)来研究吸附能和电荷转移等性质,还建立了另一个ML模型(ML-2)来研究吸附的CO分子结构。团队使用CO的红外光谱吸收峰预测了包括键长、键角和二面角在内的六个结构参数,利用这些参数,可以精确地确定小分子相对于单原子催化剂的位置。然后,就可以确定唯一的CO分子的空间相对坐标,从而实现结构反演。此外,基于上述两个ML模型,还开发了催化结构设计的人工智能生成工作流程(0图1)。首先,随机生成大量光谱以快速预测吸附能。通过将这些光谱与所需的吸附能进行比较,反复生成光谱,直到找到与所需特性相对应的光谱。然后,根据该光谱反演CO分子的结构,并通过密度泛函理论计算验证其特性。
【CP2K+机器学习】纯计算-JACS:基于光谱描述符由AI生成催化结构
图1 通过光谱描述符定向设计催化剂结构的流程图
首先,作者选择负载在TiO2上的Cu单原子作为基础研究对象,研究它与CO的吸附过程(图2a)。为了收集尽可能多的吸附状态,作者在不同温度下进行了分子动力学模拟,并从模拟轨迹中提取了约12000个吸附构型。然后,从每个周期结构中选取一个单元进行红外光谱的第一原理计算,提取特征峰的位置、位移和形状,还计算了催化特性,包括吸附能和电荷转移。同时,通过图1所示流程收集了每个吸附构型的两个键长、三个键角和一个二面角。然后,根据振动频率和红外强度构建了神经网络,用于预测上述催化性质和空间相对坐标。第一个神经网络(ML-1)是一个多任务网络,可以节省计算资源并提高模型的泛化能力和可转移性,被用来预测光谱和性质之间错综复杂的非线性关系(图2a)。
作者接着研究了上述神经网络模型在预测不同催化体系性质时的可迁移性。对于迁移学习的体系,作者从分子动力学模拟轨迹中提取了约1200个吸附构型。首先将ML-1模型应用到含有新的双原子分子(如NO、O2和N2)的体系中,通过迁移学习,它们的预测值和计算值之间都表现出良好相关性(图2b),表明该模型具有广泛的气体适用范围。然后,将ML-1模型迁移到含有Ag、Fe和Co等新金属元素的体系中。分析发现一些目标值的预测性能略有下降;但是,该模型仍是可以接受的,因为线性相关系数都在0.91以上(图2c)。此外,将ML-1模型迁移到MgO等不同的金属氧化物载体中,虽然载体结构变化较大,但是ML-1模型预测结果依然非常好(图2d)。总的来说迁移学习的成功可归功于描述符的使用,对于载体的变化,光谱描述符可以将催化活性中心的微环境信息以相同的格式和维度打包,因此基于光谱描述符的模型具有更广泛的应用范围。
【CP2K+机器学习】纯计算-JACS:基于光谱描述符由AI生成催化结构
图2 不同体系中ML-1模型对催化特性的预测结果。(a)TiO2-Cu-CO体系。(b-d)TiO2-Cu- NO、TiO2-Ag-CO和MgO-Cu-CO体系
作者除了用ML-1预测性质外,还开发了另一个多重任务神经网络ML-2,以建立光谱与结构的关系。通过光谱描述符预测了双原子分子的结构参数(图3a)。作者还在其他体系中验证了ML-2的迁移性,所有体系都表现出很高的预测准确性(图3b-d),说明ML-2能够根据分子的振动光谱峰确定其空间坐标。为了确定这种反演的准确性,作者设计了一个验证过程:先随机生成一个全新的光谱,然后,用它来反演吸附分子的位置,接着运用第一原理得出理论计算的光谱,最后,将计算出的光谱与开始随机生成的光谱进行比较。
作者在初始催化体系(TiO2-Cu-CO)和不同类型的迁移体系中都进行了上述处理,如图3e所示,随机生成的光谱与理论反演的光谱之间都表现出良好相关性。振动光谱的峰值频率和高频率区的强度通常匹配得很好,而低频率区的强度在迁移催化体系中则有细微差别,因为低频率区的红外强度很低,微小的误差会导致较大的相对差异。但大多数生成的光谱与计算光谱之间的相关性系数大于0.85(图3f)表明,虽然光谱图像与催化剂结构相比是低维数据,但从光谱信息反演部分关键催化剂的结构特征是可行的。
【CP2K+机器学习】纯计算-JACS:基于光谱描述符由AI生成催化结构
图3(a)预测了TiO2-Cu-CO体系的CO信息(b-d)分别预测了TiO2-Cu-NO、TiO2-Ag-CO和MgO-Cu-CO体系的吸附分子两个键长(e)验证TiO2-Cu-CO体系和其他TiO2-Cu-NO、TiO2-Ag-CO和MgO-Cu-CO迁移体系的ML-2模型的正确性(f)TiO2-Cu-CO体系和其他TiO2-Cu-NO、TiO2-Ag-CO和MgO-Cu-CO迁移体系的20个随机生成光谱与相应DFT计算光谱之间的相关系数
当吸附能在不强不弱的范围时,催化活性通常会达到最佳状态。由于ML-1模型可以根据光谱给出吸附能,因此可以通过不断生成光谱来找到与所需吸附能相对应的光谱。然后,利用ML-2对光谱进行结构反演,并通过DFT计算验证这些反演结构的吸附能。由于一个吸附能可以对应多个不同的结构/光谱,因此,作者为每个特定的吸附能收集了50个光谱。首先考察了TiO2-Cu-CO体系,并设定了一系列连续的目标吸附能(从-2.1到-1.4 eV,间隔为0.1 eV)。结果表明,大多数模型的平均吸附能与目标吸附能非常接近(图4a)。然后,在不同类型的迁移体系中,使用同样的验证流程,也得到了类似的结果(图4b-d)。
【CP2K+机器学习】纯计算-JACS:基于光谱描述符由AI生成催化结构
图4 根据预期吸附能和反演的催化结构筛选出的50个光谱,使用ML-2模型进行DFT验证。(a)-(d)分别为TiO2-Cu-CO、TiO2-Cu-NO、TiO2-Ag-CO和MgO-Cu-CO体系。
结论与展望
本文探讨了如何利用基于光谱描述符的机器学模型来建立金属单原子催化剂上吸附分子的光谱结构-性质关系。研究表明,通过光谱描述符的连续可调性,可以实现由人工智能生成具有连续吸附态的催化结构。这项工作不仅为催化过程的实时监控和催化性能的持续定制铺平了道路,而且预示着人工智能在化学研究中按需设计的巨大潜力,这些成果将对催化研究产生深远的影响,并为未来的研究提供了新的方向。
文献信息
Yang, T., Zhou, D., Ye, S., Li, X., Li, H., Feng, Y., … & Jiang, J. (2023). Catalytic Structure Design by AI Generating with Spectroscopic Descriptors. Journal of the American Chemical Society.
https://doi.org/10.1021/jacs.3c09299

原创文章,作者:计算搬砖工程师,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2024/01/18/b3f5e269d2/

(0)

相关推荐