比DFT快6个数量级,图神经网络快速评估有机分子在金属上的吸附能


ScienceAI 设为星标

第一时间掌握

新鲜的 AI for Science 资讯

比DFT快6个数量级,图神经网络快速评估有机分子在金属上的吸附能

编辑 | 绿萝

有机物在金属表面的吸附可以通过密度泛函理论 (DFT) 进行评估,但对于有机大分子,DFT 需要大量的计算时间,从而影响了该方法的可行性。

来自西班牙巴塞罗那科学技术学院(The Barcelona Institute of Science and Technology)和加拿大多伦多大学的研究团队,提出一种用于快速评估吸附能的图神经网络(Graph-based Adsorption on Metal Energy-neural Network,GAME-Netk)。该模型在测试集上产生的平均绝对误差为 0.18 eV,比密度泛函理论快 6 个数量级。

应用于生物质和塑料(最多 30 个杂原子),预测吸附能的平均绝对误差为 0.016 eV /原子。该框架代表了一种用于快速筛选催化材料的工具,特别是对于无法通过传统方法模拟的系统。

该研究以「Fast evaluation of the adsorption energy of organic molecules on metals via graph neural networks」为题,于 2023 年 5 月 4 日发布在《Nature Computational Science》上。

比DFT快6个数量级,图神经网络快速评估有机分子在金属上的吸附能

DFT 对于大分子计算量太大

金属/有机界面电子和化学结构是影响有机电子和光电子器件性能的至关重要因素之一。有机物在金属表面的吸附可以通过密度泛函理论 (DFT) 进行评估;DFT 已成功应用于含有多达 1 到 6 个碳原子 (C1-6) 的分子。

然而,DFT 模拟在处理结构复杂的有机大分子时变得计算量大。因此,需要更快的工具来估计塑料和生物质的分子的相互作用,但要保持 DFT 的准确性。

有机大分子(Large organic molecules)可以看作是由不同的官能团组成的,其结构信息可以通过 Benson 方程来推断分子的热力学性质,然而,将 Benson 模型转移到金属吸附的尝试都失败了。

最近,机器学习方法,例如人工神经网络 (ANN),已被引入以获得小 C1-3 片段的吸附能。

分子在表面上的另一种表示是通过图形。图以类似于 Benson 方法的方式,图以类似于 Benson 方法的方式将原子信息和连接性压缩在一个简单的数据结构中。

图神经网络(GNN)是图数据结构类型的 ANN,已被成功地应用于预测分子和材料的化学性质。

GAME-Net

在此,该团队提出了 GAME-Net,其训练于一个广泛的 DFT 数据集,该数据集由吸附在过渡金属表面的闭壳有机分子(3,315 个条目和常见官能团)组成,数据集包含 C1-4 分子,其官能团包括 N、O、S 和 C6-10 芳环。能够使用简单的分子表示来估计吸附能,其误差与 DFT 相当。

GAME-Net 可用于预测源自生物质、聚氨酯和塑料的较大分子的吸附能,从而研究不适合 DFT 的化学系统。

研究目标是使用最简单的图表示来获得金属表面上闭壳有机分子的 DFT 基态能量。

比DFT快6个数量级,图神经网络快速评估有机分子在金属上的吸附能
图 1:GAME-Net 工作流程示意图。(来源:论文)

GAME-Net 工作流程包括以下步骤:

1)「官能团」(Functional Groups,FG)数据集的生成和管理,由具有吸附在密排金属表面上的代表官能团的有机分子组成;

(2)从 DFT 优化的几何结构开发吸附和气相系统的图表示;

(3)使用 FG 数据集设计、训练和测试 GNN 模型;

(4)使用具有工业相关性(包括塑料、聚氨酯和生物质)的大分子数据集(「大分子」(Big Molecules,BM)-数据集,最多 22 个碳原子)评估模型性能。避免使用计算量大的 DFT 计算。

首先,从头开始构建 FG 数据集,包括 207 个有机分子吸附在 14 种过渡金属(Ag, Au, Cd, Co, Cu, Fe, Ir, Ni, Os, Pd, Pt, Rh, Ru 和 Zn)的最低表面能面上。所有生成的计算数据都可以从 ioChem-BD 存储库中获得。包含的分子涵盖有机化学中最常见的官能团,含有 N、O 和 S 杂原子。在 DFT PBE-D2 上自动生成和 relax 几何形状,并针对金属级别进行了重新参数化。对于每个分子,在金属表面采样了许多旋转构型和不同的吸附位置,仅保留最低能量的构型。

所需时间比 DFT 低六个数量级

总之,研究人员生成了一个稳健、均衡且化学多样化的数据集,包括化学中由 C1-10 分子组成的所有相关官能团,用于它们在密排金属表面上的吸附。该数据集用于训练所提出的 GNN 架构。

当应用于 FG 数据集时,五折嵌套交叉验证显示 MAE 为 0.18 eV。一旦经过训练,从 GAME-Net 获得能量估计所需的时间至少比 DFT 低六个数量级。

GAME-Net 在与生物质转化、聚氨酯合成和塑料化学回收相关的大分子中的应用表明,几何深度学习模型在标准第一原理技术难以解决的领域具有潜力。

该研究提供了一种工具,用于构建基于图的框架,其能够从由小分子组成的高质量数据集中学习复杂的化学模式。

原创文章,作者:计算搬砖工程师,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2024/03/13/91cad984f6/

(0)

相关推荐