Acc. Mater. Res.综述: 可解释机器学习在材料科学和化学中的应用

Acc. Mater. Res.综述: 可解释机器学习在材料科学和化学中的应用

随着越来越多的数据可用,通过使用高性能计算和高通量实验,机器学习(ML)已被证明具有加速科学研究和技术发展的潜力。目前,材料科学采用数据驱动的方法仍处于早期阶段,ML模型的预测和内部流程应提供一定程度的可解释性,允许识别潜在的模型问题或限制并揭示可能导致科学见解的意外相关性。

Acc. Mater. Res.综述: 可解释机器学习在材料科学和化学中的应用

在此,美国麻省理工学院Felipe Oviedo、英国卢瑟福阿普尔顿实验室Keith T. Butler等人总结了可解释性ML技术在材料科学和化学中的应用,并讨论了这些技术如何改善科学研究的成果。首先,作者定义了ML中两种可解释性,即“interpretability”和“explainability”的基本概念,并通过提供该领域的示例使其具体化。“Interpretability”是指模型的整个工作流程可以被人类理解;“Explainability”是指模型可以生成解释,包括通过检查模型或使用其他一些事后方法(外部解释)等。

作者展示了与一般应用相比,科学ML中的可解释性如何具有额外的限制。基于ML中的正式定义,作者制定了科学问题中模型解释的可解释性、完整性和科学有效性之间的基本权衡。在这些权衡的背景下,作者讨论了如何构建可解释的ML模型,包括模型提供了哪些见解及有哪些缺点等。

Acc. Mater. Res.综述: 可解释机器学习在材料科学和化学中的应用

图1. 一些ML中的关键概念及权衡

进一步,作者展示了许多可解释ML在各种实验和模拟研究中的应用示例,包括第一性原理计算、物理化学表征、材料开发及与复杂系统的集成。作者根据感兴趣的科学研究的性质和限制,讨论了这些案例中可解释性的不同影响和用途。此外,作者还总结了材料科学中可解释ML的各种挑战,包括模型解释缺乏置信区间或误差分布、解释没有强有力的因果保证或抵抗共同影响的弹性等。

特别是,作者强调了通过纯粹可解释ML模型来推断因果关系或达到泛化的风险及对模型解释的不确定性估计的需要。最后,作者展示了其他领域中可解释ML的发展,可能有利于材料科学问题的可解释性。为ML模型添加可解释性通常不需要比构建模型本身更多的技术知识,希望该综述将激发对ML模型的深入研究。

Acc. Mater. Res.综述: 可解释机器学习在材料科学和化学中的应用

图2. 从物理或化学数据中直接提取知识及其应用展示

Interpretable and Explainable Machine Learning for Materials Science and Chemistry, Accounts of Materials Research 2022. DOI: 10.1021/accountsmr.1c00244

原创文章,作者:v-suan,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2023/10/07/45afb0dcb1/

(0)

相关推荐