Edward H. Sargent院士AM:机器学习+DFT计算+实验反馈,快速研发新材料!

Edward H. Sargent院士AM:机器学习+DFT计算+实验反馈,快速研发新材料!
成果简介
考虑到材料领域宽广,再加上掺杂带来的指数自由度和合成途径的多样性,热电材料的探索还具有挑战性。基于此,加拿大多伦多大学Edward H. Sargent院士和阿卜杜拉国王科技大学Derya Baran(共同通讯作者)等人报道了通过采用误差修正学习(error-correction learning, ECL)结合历史数据,并使用实验反馈数据对其进行更新。因此,作者首先从之前的数据集中学习,从而调整模型以适应合成和表征方面的差异,否则难以参数化。然后,作者将这一策略应用于发现热电材料,并优先考虑在合成温度低于300 ℃。
作者记录了一个以前未开发的热电材料化学家族,即PbSe: SnSb,发现该化学家族中的最佳候选物质,2 wt% SnSb掺杂的PbSe,其功率因数超过PbSe的2x倍。该研究表明,对比由最先进的机器学习(ML)模型驱动的高通量搜索,闭环实验策略将寻找优化材料所需的实验次数减少了3x倍。作者还观察到这种改进依赖于ML模型的准确性,其表现出收益递减的方式:当达到一定的准确性时,与实验路径相关的因素就开始主导趋势。
研究背景
热电材料(Thermoelectric materials)利用塞贝克(Seebeck)效应将热能转化为电能,其中热梯度导致电流的产生,将废热转化为电能的能力为回收机械和电气过程中损失的能量提供了一条途径。然而,热电材料的设计和发现面临着巨大的化学空间、非凸的成分-性质映射和掺杂剂对材料性质的非线性影响。
利用高通量密度泛函理论(DFT)基模拟和机器学习(ML)基性质预测搜索,对具有所需性质的材料进行了大规模化学空间搜索,但与DFT计算相关的大量计算成本阻碍了对化学空间的广泛探索,同时这种方法并不能解释模拟和实验之间的差距。近年来,在ML模型的帮助下,前者的缺点已经得到了解决,这些模型可从现有的数据集中学习,并筛选更大的化学空间。
之前的研究要么需要预定义的数据融合方法来整合可用数据和获取的数据,要么利用相关采样数据来估计属性分布。第一个要求限制了信息如何在两个数据源之间传输,而后者在计算上成本昂贵,甚至可能无法从可用的数据集中进行管理。因此,对材料-属性关系的准确学习是有限的,不利于有效的材料探索,这种探索是通过对获得的数据的准确性评分来量化的,并根据性能进行排名。
图文导读
ECL实验
作者将挑战表述为一个纠错问题:对两种成分c1c2的实验室实验的观察结果(用y表示),可表示为:
Edward H. Sargent院士AM:机器学习+DFT计算+实验反馈,快速研发新材料!
其中c1c2是希望比较的材料,T1T2是进行比较的温度,PF(·)表示实验室测量的功率因数。y取决于合成参数和方法。因此,不容易将y与现有数据集连贯地合并在合并后的数据上训练ML模型。
Edward H. Sargent院士AM:机器学习+DFT计算+实验反馈,快速研发新材料!
其中X1X2是要比较的两种材料组成c1c2的矢量表示,T1T2是进行比较的温度,PF(·)表示功率因子,是在现有数据集上训练的先验模型。作者使用了一个密集的神经网络,它可从数据中学习来建模误差修正函数,可实现的纠错比例取决于用于化学组分矢量表示的数据量、模型和方法。
Edward H. Sargent院士AM:机器学习+DFT计算+实验反馈,快速研发新材料!
图1. ECL实现闭环材料发现
大功率因数热电的发现
作者在实验室对573种掺杂和合金材料进行了实验测量,涵盖52种不同的元素。该数据集涵盖了多种化合物,包括氧化物、其他硫族化合物、硅化物、锗化物等。使用Magpie训练的先前模型显示出最好的交叉验证性能,优于Roost和CrabNet。为确定TPOT在寻找最优ML模型方面的有效性,作者还使用相同的训练-测试分裂和相同数量的交叉验证分裂分别训练和优化随机森林回归模型的超参数。作者发现,下一个最好的模型CrabNet,在对化合物的排名进行错误修正后,表现不佳。
本文构建的精确先验模型至少减少了(1/5×100%)=20%的实验次数(在这种情况下的实验总轮数为5)。若使用最精确的先验模型根据功率因数的减小顺序对候选材料进行排序,则最佳候选成分(PbSe)0.98(SnSb)0.02排在第98位。因此,目前的方法将需要测试的候选数量减少了多达83%,即不到需要进行的实验数量的1/3。
Edward H. Sargent院士AM:机器学习+DFT计算+实验反馈,快速研发新材料!
图2. 有无ECL的ML模型对可用数据和获取数据的性能
Edward H. Sargent院士AM:机器学习+DFT计算+实验反馈,快速研发新材料!
图3. 实验测量材料的热电性能
高功率因数的起源
通过密度泛函理论(DFT)计算,作者研究了 (PbSe)0.98(SnSb)0.02的高性能原子的起源。作者从Materials Project中获得了PbSe超级单体的单体晶胞,并利用它构建了一个216个原子的超级单体晶胞。
XRD表明,少量合金化不会改变结构。在引入自旋轨道耦合(SOC)下,对原始和掺杂弛豫结构进行了自洽HSE06 xcfunctional计算。比较PbSe和PbSe: SnSb的电子结构,作者发现Sn和Sb的引入分别调节了导带最小值(CBM)和价带最大值(VBM)附近的态密度(DOS)。这种调制降低了空穴有效质量,提高了PbSe: SnSb复合材料的整体输运性能,从而导致更大的功率因数。
Edward H. Sargent院士AM:机器学习+DFT计算+实验反馈,快速研发新材料!
图4. 最佳热电候选材料的结构和DFT分析
文献信息
Closed-loop Error Correction Learning Accelerates Experimental Discovery of Thermoelectric Materials. Adv. Mater., 2023, DOI: 10.1002/adma.202302575.

原创文章,作者:Gloria,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2023/10/03/3dbc62a632/

(0)

相关推荐