机器学习顶刊汇总：铁电、电催化、锂离子电池、储能材料综述、DFT、MD等领域应用

1. 橡树岭实验室Nat. Mach. Intell.: 主动学习用于发现铁电材料结构-性能关系

铁电材料中结构和拓扑缺陷的新兴涌现功能支撑了其从畴壁电子到高介电和机电响应的极其广泛的应用范围，许多功能已通过局部扫描探针显微镜方法被发现和量化。然而到目前为止，搜索一直是基于试错法或根据直觉/预先假设使用畴壁结构等辅助信息来识别潜在的感兴趣对象，随后进行人工探索。

在此，美国橡树岭国家实验室Maxim A. Ziatdinov, Sergei V. Kalinin等人开发和实施了基于深度核学习（DKL）的实验工作流程，用于主动发现铁电材料中的结构-性能关系。其中，DKL基于高斯过程（GP）回归，可以表示为GP与深度神经网络的组合。与使用单个（或少量）标量描述符来引导导航过程且不包含先验知识的经典贝叶斯优化（BO）策略相比，该方法使用结构图像中包含的数据来识别光谱测量的位置，并同时识别新位置建立结构-性能关系。这一发现过程由预测行为及其不确定性构成的获取函数指导并反映了实验的目标，该目标可以是特定性能的优化、与给定模型的相似性或新颖性发现。通过这种方式，作者结合相关机器学习方法建立多维数据集之间的关系并获得相应的不确定性，并将基于人类物理的决策在获取函数的选择中进行编码。

图1. 随机采样数据的DKL重建

为了说明DKL在实验中的应用原理，作者进行了压电响应力显微镜（PFM）测量实验以研究极化滞后与铁电/铁弹性畴结构之间的关系。结果表明，当DKL由场内和场外磁滞回线引导时显示出不同的探索路径和采样点，这意味着场内和场外磁滞回线受不同机制支配。此外，原则上DKL的深度神经网络部分可在来自相同或相似系统的先前实验数据上进行预训练，这在某种程度上相当于迁移学习，然而这需要对分布外漂移效应进行严格分析（如由于不同的显微镜设置）。同样，该工作流程可扩展到其他扫描探针显微镜（SPM）模式，包括电流-电压曲线或弛豫测量。总之，这项研究提出的 DKL方法是通用的，可应用于广泛的现代成像和光谱方法，此外还可用于更复杂的参数空间，如组合扩展库或分子系统中的材料发现等。

图2. 基于DKL-BO的自动化PFM实验

Experimental discovery of structure–property relationships in ferroelectric materials via active learning, Nature Machine Intelligence 2022. DOI: 10.1038/s42256-022-00460-0

2. 殷宗友/夹国华/赵海涛SmartMat: 机器学习加速CO₂RR电催化剂计算和设计

过去的几十年中机器学习（ML）影响了电催化领域，研究人员开始利用基于ML的数据驱动技术来克服计算和实验限制以加速合理的催化剂设计。然而，很少有讨论ML流程整体协同加速CO₂还原（CO₂RR）电催化剂的计算和合理设计的综述。

在此，澳大利亚国立大学殷宗友教授、科廷大学夹国华教授及中科院深圳先进院赵海涛副研究员等人总结了机器学习（ML）在CO₂RR电催化剂设计中应用的最新进展。与之前这方面的综述不同，作者主要将ML在电催化CO₂RR中的应用分为两个方面：一方面，研究人员基于AI技术构建了势函数，替代了求解薛定谔方程这种耗时的量子化学计算过程，从而加速了计算并达到大规模、低成本高通量模拟的目的，这是ML辅助加速计算过程的体现；另一方面，训练数据来源于高通量实验数据、理论计算或模型构建数据集，这是ML辅助合理设计过程的体现，包括建立数据集/数据源选择、描述符选择和验证、ML算法选择和模型预测。作者详细讨论了这两种策略，并概述了ML在CO₂RR电催化剂设计中的机遇和未来挑战。

图1. ML加速CO₂RR电催化剂计算和设计的示意图

最后，作者总结了未来ML在CO₂RR电催化剂设计中的挑战：1）计算成本问题。DFT计算仍将是短期内筛选电催化剂和研究机理的主要工具，希望ML将在未来大幅降低昂贵的DFT计算成本；2）数据来源仍面临挑战。数据集是未来合理设计CO₂RR电催化剂的基础，然而目前缺乏用于模型训练和验证的足够多样化和广泛的实验数据集；3）描述符的兼容性问题。由于实验观察和 DFT计算之间的代沟，实验和模拟描述符之间的交互目前是不兼容的；4）算法的壁垒问题。算法参数可能会造成误差，如何消除这些误差需要算法调试。因此，有必要基于数据科学方法确保数据集和训练模型的可靠性和可重复性；5）可靠ML流程的合理设计问题。考虑到决速步骤的多样化，未来集成DFT计算、ML和实验的工作流程将促进对电催化CO₂RR的进一步理解。

图2. 不同ML方法训练模型的预测性能比较

Machine learning accelerated calculation and design of electrocatalysts for CO₂ reduction, SmartMat 2022. DOI: 10.1002/smm2.1107

3. 韦国丹/周光敏/张璇EEM: 脉冲测试+机器学习快速估计电池剩余容量

锂离子电池已广泛用于消费电子、储能和电动汽车领域，估算其容量的直接方法是直接测量，但完全充放电过程通常需要数小时才能完成。此外，来自传感器的测量噪声很容易影响实时电阻估计，而容量估计通常依赖于准确的荷电状态（SOC）。因此，如何准确获得SOC估计仍然是另一个挑战。

在此，清华-伯克利深圳学院（TBSI）韦国丹副教授、周光敏副教授及张璇等人通过将常规的实时电流短脉冲测试与数据驱动的高斯过程回归（GPR）算法相结合，成功开发并验证了一种有效的电池估计方案，适用于容量从100%健康状态（SOH）到 50% 以下的电池，最终估计的平均准确率高达95%。首先，作者基于所提出的方法从电流脉冲测试的原始测量中获取特征，以建立准确有效的容量估计；其次，选择在不同SOC和电压阶段上执行短期电流脉冲测试来捕获电池退化信息；第三，方便地从电流脉冲测试的电压响应的转折点中提取特征。其中，输入是脉冲电压的采样点，输出是相应的测量容量。作者比较了5种不同的机器学习方法，并最终选择了结果可靠且鲁棒性更好的GPR算法来进行容量估计。

图1. 五种典型机器学习方法的性能比较

总体而言，这种脉冲测试只持续几秒钟，便于在锂离子电池的各种工作条件下进行。与传统的长充放电方法相比，所提出的脉冲测试可将测试时间减少80% 甚至更多。作者通过探索不同电压阶段和SOC对容量估计精度的影响来研究机制，结果表明电压在3.4V左右时精度最好且SOC低时精度高，相同SOC下精度高于相同电压脉冲下精度。此外，该模型的有效性主要取决于脉冲测试，因为它可以反映随着老化的发展而极化加深的电池内阻。其次，需要在脉冲测试前将电池统一到相同的状态。否则，即使充电相同的电量，实际的SOC也会随着老化程度的不同而不同。同时，脉冲曲线反映了电池在充电阶段的老化程度及其电压平台的变化。总之，这种与数据驱动算法相结合的新型脉冲测试为快速估计剩余电池容量打开了一个新窗口。

图2. 脉冲特征对预测能力的物理解释

Fast Remaining Capacity Estimation for Lithium-ion Batteries Based on Short-time Pulse Test and Gaussian Process Regression, Energy & Environmental Materials 2022. DOI: 10.1002/eem2.12386

4. 南策文院士/沈忠慧Interdisciplinary Materials: 储能材料中的机器学习综述

机器学习（ML）凭借其极强的数据分析能力，在材料研究范式的革命中显示出无限的潜力。为了促进ML在材料科学中的更大进步，加强材料与计算机/物理/数学之间的交叉融合势在必行。

在此，清华大学南策文院士、武汉理工大学沈忠慧研究员等人总结了机器学习（ML）在储能材料研发中的最新进展，并对ML在材料科学中的创新实施提供了一些见解。首先，作者介绍了一个基本的ML通用工作流程，包括目标、数据、特征化、算法、评估和应用六个步骤，讨论了每个步骤中的关键概念、方法、示例和挑战。然后，作者以介电电容器（DC）和锂离子电池（LIBs）作为两个具有代表性的例子，从三个方面重点介绍了ML在储能材料研发中的最新进展，包括发现和设计新材料、丰富理论模拟及辅助实验和表征。目前，ML已经与实验过程的整个生命周期广泛集成并显示出解决复杂问题的巨大潜力，极大地加快了储能材料的研发步伐。然而，值得注意的是，仍有许多挑战有待解决。

图1. ML的通用工作流程

为此，作者概述了对储能材料中ML应用的未来挑战和机遇的一些看法：1）建立全生命周期材料数据库。大多数材料数据库主要包含有关原子/分子/晶体结构等相应的内在特性信息，但材料性能在整个生命周期中也可能受外部因素的影响。因此，以微观结构为主线进行全生命周期研究不仅可以为科技创新提供更多沃土，也更有利于材料的实际应用；2）开发多目标优化算法。目前ML在优化单目标性能方面取得了成功，然而当处理两个或更多的性能时，优化问题会变得棘手。因此，迫切需要开发新的高效算法；3）提高ML的可解释性。尽管ML算法能够实现快速准确的预测，但黑箱特性使其决策难以理解。因此，保持ML的可量化解释性和智能预测之间的平衡是一项艰巨的挑战，需要跨多个学科进行深度集成和协作。

图2. 人工智能原子力显微镜（AI-AFM）的示意图及应用

Machine learning in energy storage materials, Interdisciplinary Materials 2022. DOI: 10.1002/idm2.12020

5. npj Comput. Mater.: 机器学习加速发现具有超低晶格热导率的四元硫属化物

具有本征低晶格热导率的新型化合物在基础研究中受到高度追捧，这将有助于设计和发现适用于设备应用的高效材料。高通量（HT）DFT 计算等现代计算方法加速了新化合物的发现，但该方法可能会错过许多迄今未知的稳定化合物。

为此，美国西北大学Chris Wolverton, Cheol Woo Park及Koushik Pal等人设计了一种基于晶体图卷积神经网络（CGCNN）的先进机器学习（ML）模型，用来发现新的四元硫属化物AMM’Q₃（A/M/M ‘=碱金属、碱土金属、后过渡金属、镧系元素，Q=硫属元素）。该模型对输入晶体结构的体积（即尺度）不敏感，从而使模型能够在不知道其DFT弛豫体积的情况下更准确地预测假设化合物的性质。结果表明，材料发现的总体成功率相当高（~11%），作者总共发现了461种可能合成的新型四元硫属化物（包括99 种热力学稳定和362种低能亚稳定化合物）并对4199种独特的AMM’Q₃组合物进行DFT计算验证。作者随机选择了14种DFT稳定的半导体和非磁性化合物研究热传输特性，计算表明这些化合物都表现出超低的晶格热导率。

图1. 多目标ML框架的图示

通过分析其中一种化合物KLiZrSe₃的谐波和非谐波晶格动力学特性，作者发现该化合物家族中的超低晶格热导率源于（a）产生低声速的软声学声子分支，（b）出现在低频的声子分支之间的强杂化，（c）在格林乃森参数的高值中可见的较大声子非谐性。此外，低能量几乎无色散的光学声子分支的存在也造成载热声子寿命缩短，进而导致非常低的晶格热导率。这项工作能够鼓励基于图神经网络的ML模型的应用和开发，以有效地发现新材料。虽然这项研究绕过了输入晶体结构的DFT弛豫体积信息，但必须设计一个可解释弛豫期间晶体结构在应力和离子位置的ML模型。总之，这项研究证明了尺度不变ML模型在预测新化合物方面的高效性，并为这些新化合物提供了实验研究机会。

图2. 预测的稳定化合物的热传输特性

Scale-invariant machine-learning model accelerates the discovery of quaternary chalcogenides with ultralow lattice thermal conductivity, npj Computational Materials 2022. DOI: 10.1038/s41524-022-00732-8

6. 圣母大学罗腾飞/马瑞民ACS AMI: 基于强化学习探索高热导率非晶聚合物

开发具有理想导热性的非晶聚合物具有重要意义，因为其在热传输至关重要的应用中无处不在。然而，传统的爱迪生式方法很慢且不能保证材料开发的成功。

在此，美国圣母大学罗腾飞、马瑞民等人采用基于强化学习的逆向材料设计算法，利用文献中生成的469个分子动力学（MD）模拟数据探索高热导率（TC≥0.400 W/m·K）的非晶聚合物。作者使用机器学习生成的基准数据库 PI1M（其中包含约100万个虚拟聚合物结构）训练基于循环神经网络（RNN）的聚合物生成器，并使用该模型生成新的聚合物结构。此外，作者训练了随机森林（RF）模型以量化469个MD模拟数据上的化学-TC关系，该模型为新生成的聚合物提供反馈（即预测TC）。结果显示，对于所有生成的TC≥0.400 W/m·K的聚合物，其TC介于0.400~0.430 W/m·K之间。作者通过计算合成可及性分数评估了其可合成性，并使用MD模拟验证了所选聚合物的热导率。

图1. 本研究中使用的聚合物结构表示示例及TC分布

最终，作者通过MD模拟验证了30种聚合物结构，其TC范围从0.360~0.693 W/m·K，其中最佳导热聚合物的TC为 0.693 W/m·K。根据合成可及性分数估计，这些聚合物很容易合成。MD计算的TC可能会受到所用力场准确性的影响，但由于作者使用相同的力场来生成所有数据，因此本研究的结果和结论应该是自洽的。此外，在非晶聚合物中，构象比键合相互作用本身更重要，因为热载体会因结构无序而分散。此次模拟的聚合物主要涉及有机分子中包含的常见键和原子，因此使用的力场应该能够捕获构象，从而提供对非晶聚合物TC的一致预测。这项工作证明了使用强化学习来设计具有高TC聚合物的适用性，可以推广到设计具有不同特性的聚合物材料。

图2. 使用MD模拟的无非晶聚合物生成和TC计算图

Exploring High Thermal Conductivity Amorphous Polymers Using Reinforcement Learning, ACS Applied Materials & Interfaces 2022. DOI: 10.1021/acsami.1c23610

原创文章，作者：v-suan，如若转载，请注明来源华算科技，注明出处：https://www.v-suan.com/index.php/2023/10/14/e6877549be/

机器学习顶刊汇总：铁电、电催化、锂离子电池、储能材料综述、DFT、MD等领域应用

相关推荐