Nature Chemistry:化学模拟革命!机器学习在化学反应中的强大预测力!

第一作者:Shuhao Zhang
通讯作者:Nicholas Lubbers, Richard A. Messerly, Justin S. Smith
通讯单位:卡内基梅隆大学,洛斯·阿拉莫斯国家实验室,南卫理公会大学,英伟达公司
Nature Chemistry:化学模拟革命!机器学习在化学反应中的强大预测力!
成果速览
本研究开发了一种通用的反应性机器学习势能(ANI-1xnr),通过自动化采样凝聚相反应,成功应用于五个不同的系统:碳固相成核、乙炔形成的石墨烯环、生物燃料添加剂、甲烷燃烧以及早期地球小分子自发形成甘氨酸。
在所有研究中,ANI-1xnr与实验数据(如果有的话)和/或使用传统模型化学方法的先前研究紧密匹配。该研究证明了ANI-1xnr是C、H、N和O元素在凝聚相中的一种高度通用的反应性MLIP,使得高通量in silico反应化学实验成为可能。
Nature Chemistry:化学模拟革命!机器学习在化学反应中的强大预测力!
图文导读
Nature Chemistry:化学模拟革命!机器学习在化学反应中的强大预测力!
图1:纳米反应器主动学习工作流程和特定应用概述。AL循环是一种自动化、迭代和高效的方法,用于开发MLIP。AL生成的训练数据集仅包含基于MLIP集合识别的高不确定性结构的量子计算。通过NR模拟采样与凝聚相反应化学相关的结构。初始系统由随机配置的小分子构建,这些小分子由C、H、N和O元素组成。通过使用当前MLIP进行动态模拟,并在极端波动的温度和体积下诱导化学反应。
Nature Chemistry:化学模拟革命!机器学习在化学反应中的强大预测力!
图2:使用纳米反应器主动学习生成的数据集(ANI-1xnr)分析。图中展示了与文献中非反应性、近平衡分子在真空中的AL数据集(ANI-1x; 红色点)相比,ANI-1xnr数据集(蓝色点)的二维可视化。图中展示了H、C、N和O元素的局部原子环境。ANI-1xnr数据集不仅涵盖了ANI-1x数据集中采样的大部分区域,而且还在这些区域之间进行了插值,甚至大幅扩展了这些区域。
Nature Chemistry:化学模拟革命!机器学习在化学反应中的强大预测力!
图3:ANI-1xnr在碳固相成核模拟中的结果。图中展示了在3.52 g cc−1、2.25 g cc−1和0.50 g cc−1特定密度下的结果。模拟以随机碳位置开始,最终结构与各自密度下预期的碳相一致。
Nature Chemistry:化学模拟革命!机器学习在化学反应中的强大预测力!
图4:氧气对乙炔形成石墨烯环的影响模拟结果。图中展示了在不同O2/C2H2比例下,三、四、五、六、七元环形成的数量与模拟时间的关系。增加氧气比例会减少形成的环的数量,这与Lei等人的模拟结果和实验文献一致。
Nature Chemistry:化学模拟革命!机器学习在化学反应中的强大预测力!
图5:生物燃料添加剂模拟结果。图中展示了在不同生物燃料模拟中,O2和主要产物(CO、CO2和H2O)的追踪图。对于每种添加剂,与清洁生物燃料相比,IDT显著降低。
Nature Chemistry:化学模拟革命!机器学习在化学反应中的强大预测力!
图6:甲烷燃烧模拟结果。图中展示了O2、CH4和主要产物(CO、CO2和H2O)的追踪图。追踪图和快照证实了ANI-1xnr对这种系统的化学反应的合理预测。然而,ANI-1xnr的反应性明显高于文献中的特定应用MLIP。
Nature Chemistry:化学模拟革命!机器学习在化学反应中的强大预测力!
图7:Miller实验模拟结果。图中展示了从简单小分子物种(例如NH3、CO、H2O、H2和CH4)开始形成甘氨酸的反应途径。绿色箭头表示Wang等人或Saitta和Saija识别的反应。橙色箭头表示与Wang等人或Saitta和Saija的反应类似。
亮点介绍
1. 开发了一种适用于广泛反应化学的通用反应性机器学习势能(ANI-1xnr),无需重新拟合即可应用于不同系统。
2. ANI-1xnr在碳固相成核、石墨烯环形成、生物燃料添加剂、甲烷燃烧和早期地球条件下甘氨酸的自发形成等多个系统中均与实验数据和传统模型化学方法紧密匹配。
3. 通过主动学习(AL)策略,自动化采样原子位置,有效探索了化学和结构变异,生成了包含超过1,000种独特分子的数据集。
4. 研究证明了自动化化学探索工作流程的能力,建立了一个快速、准确且通用的潜力,能够模拟包含C、H、N和O元素的广泛实际反应系统。
计算模拟
在本研究中,计算模拟是核心方法之一,涉及多种计算技术,包括密度泛函理论(DFT)计算、分子动力学(MD)模拟以及机器学习(ML)模型的开发和应用。
DFT计算:研究中使用了基于DFT的方法来生成训练数据集,其中采用了Becke, Lee, Yang和Parr(BLYP)泛函、三重ζ价基组加上两组极化函数(TZV2P)、Goedecker-Teter-Hutter(GTH)赝势以及Grimme的第三代分散校正(D3)方法。DFT计算用于提供精确的能量和原子力数据,作为机器学习模型训练的基准。
分子动力学模拟:研究中应用了分子动力学模拟来模拟和研究不同条件下的化学反应和物理过程。通过使用当前的机器学习势能模型,模拟了极端温度和体积波动下的化学反应,以诱导化学键的形成和断裂,从而探索新的化学结构和反应途径。
机器学习模型:研究开发了一种名为ANI-1xnr的通用反应性机器学习势能。该模型通过自动化采样和迭代的主动学习过程进行训练,能够描述广泛的化学系统而不需求额外的专门化。机器学习模型的训练包括能量和力项,使用早期停止和学习率退火策略以防止过拟合,并确保高保真度拟合。
这些计算模拟方法的结合使得研究能够在原子尺度上深入理解和预测化学反应和物理过程,为材料设计和化学过程提供了强有力的计算工具。通过这些方法,研究成功地探索了从碳固相成核到甲烷燃烧等多个重要化学过程,并证明了机器学习势能作为一种高效且通用的工具在凝聚相化学研究中的潜力。
文献信息
标题:Exploring the frontiers of condensed-phase chemistry with a general reactive machine learning potential
期刊:Nature Chemistry
DOI:10.1038/s41557-023-01427-3

原创文章,作者:Gloria,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2024/04/16/9c1b6c908c/

(0)

相关推荐