过去的几十年中机器学习(ML)影响了电催化领域,研究人员开始利用基于ML的数据驱动技术来克服计算和实验限制以加速合理的催化剂设计。然而,很少有讨论ML流程整体协同加速CO2还原(CO2RR)电催化剂的计算和合理设计的综述。在此,澳大利亚国立大学殷宗友教授、科廷大学夹国华教授及中科院深圳先进院赵海涛副研究员等人总结了机器学习(ML)在CO2RR电催化剂设计中应用的最新进展。与之前这方面的综述不同,作者主要将ML在电催化CO2RR中的应用分为两个方面:一方面,研究人员基于AI技术构建了势函数,替代了求解薛定谔方程这种耗时的量子化学计算过程,从而加速了计算并达到大规模、低成本高通量模拟的目的,这是ML辅助加速计算过程的体现;另一方面,训练数据来源于高通量实验数据、理论计算或模型构建数据集,这是ML辅助合理设计过程的体现,包括建立数据集/数据源选择、描述符选择和验证、ML算法选择和模型预测。作者详细讨论了这两种策略,并概述了ML在CO2RR电催化剂设计中的机遇和未来挑战。图1. ML加速CO2RR电催化剂计算和设计的示意图最后,作者总结了未来ML在CO2RR电催化剂设计中的挑战:1)计算成本问题。DFT计算仍将是短期内筛选电催化剂和研究机理的主要工具,希望ML将在未来大幅降低昂贵的DFT计算成本;2)数据来源仍面临挑战。数据集是未来合理设计CO2RR电催化剂的基础,然而目前缺乏用于模型训练和验证的足够多样化和广泛的实验数据集;3)描述符的兼容性问题。由于实验观察和 DFT计算之间的代沟,实验和模拟描述符之间的交互目前是不兼容的;4)算法的壁垒问题。算法参数可能会造成误差,如何消除这些误差需要算法调试。因此,有必要基于数据科学方法确保数据集和训练模型的可靠性和可重复性;5)可靠ML流程的合理设计问题。考虑到决速步骤的多样化,未来集成DFT计算、ML和实验的工作流程将促进对电催化CO2RR的进一步理解。图2. 不同ML方法训练模型的预测性能比较Machine learning accelerated calculation and design of electrocatalysts for CO2 reduction, SmartMat 2022. DOI: 10.1002/smm2.1107