材料的电子结构,如状态密度(DOS),提供了对其物理和功能特性的关键见解,并为许多材料筛选和发现工作流程提供了高质量特征的宝贵来源。然而,常见DFT计算 DOS的成本过于昂贵,因此需要更便宜但足够准确的替代方法。在此,美国橡树岭国家实验室Victor Fung等人开发了一种基于图神经网络的通用机器学习(ML)方法,用于纯粹从原子位置预测DOS,比DFT快六个数量级。要使用ML将原子结构准确映射到DOS,需要一种对系统的完整组成和结构维度敏感的表示。作者使用基于图的系统表示,其中包含作为节点的原子和作为边的原子间距离作为图神经网络的输入模型以有效地捕捉组成和结构维度。该方法还与系统尺寸成线性关系,这允许对超大晶体或无定形系统进行DOS预测,只需对整体工作流程进行微小的更改。其他改进途径还包括更好的DOS输出表示,如使用主成分基础或使用自动编码器,只要重建误差足够低,这将有助于减少输出维度。或者,将ML预测耦合到物理模型,如紧束缚模型或Δ-ML方法中较低水平的DFT理论可用于提高准确性并减少数据需求。图1. 图神经网络模型的总体示意图进一步,作者还提出了一种通过附加损失函数应用物理约束的新方法,该方法用于通过自动微分训练模型以获得梯度。这种方法的一个优点是所需约束的灵活性,可在不修改工作流其余部分的情况下对其进行更改。同时,在训练数据有限的其他情况下,将功能空间限制为物理上有意义的解决方案的受限模型架构可能被证明是有益的。这种DOS预测方法在材料筛选和ML研究中特别有用,可获得计算成本低廉的电子特征,这些研究使用DOS作为输入来预测更复杂的功能性质。同时,该模型的快速度也使其适合于在MD模拟过程中提供电子结构信息或用于以数字孪生的形式实时告知实验的方法。随着包含DOS数据的计算数据集不断快速扩展,建立完全通用的固体电子结构ML模型的目标已经触手可及。图2. 基于三个数据集曲线来研究模型的数据依赖性Physically Informed Machine Learning Prediction of Electronic Density of States, Chemistry of Materials 2022. DOI: 10.1021/acs.chemmater.1c04252