顶尖团队案例汇总!看材料基因组技术如何助力新能源材料研究

2016年5月发表于Nature正刊一篇利用实验废弃数据,通过机器学习和数据挖掘指导材料成功发现的封面文章,是对材料基因组技术应用有效性的最好诠释。

从目前现状看,尚未发现在新能源材料领域有系统应用材料基因组技术指导材料研发的典型成功案例。但利用材料基因组技术的单一或几种方法组合指导和加速新能源材料研发的案例却屡见不鲜。

最具有代表性的应用案例,Ceder团队的光催化

CEDER课题组有一篇最具有代表性的就是搜索光催化水的材料的文章。

顶尖团队案例汇总!看材料基因组技术如何助力新能源材料研究

他在所有的材料数据库中,根据相图,先搜索具有稳定结构的材料,以保证这种材料可以被稳定的制备出来,然后根据光催化水的材料的性质,搜索材料带隙在1.3~3.6 eV之间的材料,然后对于材料对比能带位置,保障材料的导带和价带在合适的位置,再通过实验验证这些被搜索出来的材料是否能被用作光催化分解水的材料,最终找到了16种具有这些光催化可能性的材料。

相关学习资料:

 

[1] WU Y LAZIC P’HAUTIER G eta1.First principles high throughput screening of oxynitrides forwater-splitting photocatalysts[J]Energy &Environmental Science,2012,6(1):157—168.

13万选30,OQMD数据库大显身手

WOLVERTON在研究如何抑制锂离子电池的正极退化这一影响电池寿命的关键因素问题时,采用了高通量筛选的方法,首先确定了涂层需要的物理性质,然后再从OQMD数据库中的13万个含0的结构中进行筛选,最终筛选出了30种最可能的涂层的候选材料。

相关学习资料:

[1] AYKOL M,ⅪM S,HEGDE VI,et a1.High-through put computational design of cathode coatings for Li-ion batteries[J].Nature Communications,2016,7:13779—13790.

在新能源材料研究领域,利用材料基因组高通量计算技术指导材料研发还处于初步发展阶段,目前已知理论方面的应用指导技术主要有以下几类。

(1)  材料构象表征(representation)

最早运用在化学和生物领域,研究高分子的链式表达以及原子之间的键长键角表征。

早在1985年,SMILES 符号就通过分子图论方法建立了一套化学“语言”,成功的对化学分子进行编码。

但是,由于晶体结构具有周期重复性,且晶体结构中原子有对称操作,使得晶体结构的表象的唯一性要求提高,直到最近,才不断有较成功的对晶体结构的表象技术报道。

SCHOTT等利用对径向分布函数(pair radial distribution function)作为晶体结构表象,并把这种表象作为机器学习模型的输入,成功预测出大体系(约100原子)在费米能级处的能态密度。

FABER等则在考虑周期性的条件下用传统的库仑矩阵(coulomb matrix)作为晶体结构的表象,成功预测了材料的形成能。

相关学习资料:

 

[1] WEININGER D SMILES.A chemical language and information system.1.Introduction to methodology and encoding rules[J].Journal of Chemical Information&Computer Sciences,1988,28(1):31-36.

 

[2] SCHUTT K T,GLAWE H,BROCKHERDE F,et a1.Howto represent crystal structures for machine learning:towardsfast prediction of electronic properties[J].Physical Review B,2013,89(20):163—168.

 

[3] FABER F,LINDMAA A,VON LILIENFELD O A,et a1.Crystal structure representations for machine learning models offormation energies[J].International Journal of Quantum Chemistry,2015, 115(16、:1094一1101.

(2)  高通量计算及筛选(high-throughput calculation and screening)

在近几十年随着密度泛函理论 (density functional theory)的日渐成熟,科学家可以从量子力学角度出发精确有效地计算材料中原子间的电子相互作用,从而预测出材料的一系列性质,从理论上指导材料设计。

伴随着强大的高性能并行计算能力以及高效率的算法,由高通量计算(high-throughput calculation)以及高通量筛选(high—throughputscreening)驱动的材料大数据技术应运而生。通过高通量计算得到大量的材料性质,并从中高通量筛选出符合条件的材料,成为了材料科学家发现新材料的重要手段。

CEDER等通过高通量计算数千种复合物的充放电电压和理论容量的关系,再进行电子迁移能力、稳定性和安全性等条件的筛选,成功预测了安全性和充放电电压的关系,并预测了理想的电池正极材料。

相关学习资料:

 

[1] CEDER G Opportunities and challenges for first—principles materials design and applications to Li battery materials[J].MRS Bulletin,2010,35(9):693-701.

 

CASTELLI等通过稳定性、能带位置以及禁带宽度等条件对具有立方钙钛矿结构的共含有52种金属元素的5400种半导体氧化物及氮氧化物进行高通量筛选,成功识别现有的10种理想的氧化物和5种理想的氮氧化物,并预测出9种未知的组合材料作为高效率光解水材料。

 

相关学习资料:

 

[1] CASTELLI I E,OLSENT’DATTA S,et a1.Computational screening of perovskite metal oxides for optimal solar light capture[J].Energy& Environmental Science,2012,5(2):5814-5819.

MADSEN等通过高通量方法在无机晶体结构数据库(ICSD)中的570种含锑元素的复合物中自动搜索新型热电材料,发现具有津特尔 (Zintl)相的LiZnSb是一种理想的n型热电材料。

相关学习资料:

 

[1] MADSEN GK H.Automated search for new thermoelectric materials:The case of LiZnSb[J].Journal of theAmerican Chemical Society, 2006,128(37):12140-12146.

(3)  机器学习(machine learning)

近年来人工智能被越来越多地应用在各种领域,以期发现运用传统手段无法发现的现象和规律。

CEDER等通过贝叶斯概率统计方法,以无机晶体结构数据库中的晶体结构数据作为训练集(training set),晶体构型和元素种类作为模型的输入(input),在耗费少量计算资源的情况下发现了209种新型三元氧化物。

相关学习资料: 

 

[1] HAUTIER G FISCHER C C,JAIN A,et a1.Finding natures missing ternary oxidecompounds using machine learning and density functional theory[J].Chemistry of Materials,2010,22(12):3762—3767.

CORMA等运用支持向量机(Suppoa Vector Machine)的方法,以沸石合成过程中的合成变量(synthesis variables)作为模型的参数(反应初始凝胶的浓度、反应过程、温度和时间等),准确地预测出合成产物的结构特性和热动力学性质。

相关学习资料:

 

[1] SERRA J M,BAUMES L A,MOLINER M,et a1.Zeolite synthesis modelling withsupport vector machines:A combinatorial approach[J]. Combinatorial Chemistry&High Throughput Screening,2007,10(1): 13—24.

(4)  神经网络(neural network)

 

神经网络技术是一种模仿动物大脑中神经元行为特征并进行分布式并行信息处理的算法学模型,通过调整内部大量节点之间的(非)线性的关系,达到处理复杂联系的目的。

在材料学领域,也有种种变量之问的复杂关系需要探寻,如晶体的构效关系,材料合成过程中反应变量与产物之间的关系等。

MAYYAS等运用前向传播(forward propagation)技术,以铜的质量百分比和碳化硅的积比例作为模型的输入,密度、孔洞率和硬度作为模型的输出,根据铝铜基的碳化硅的结构特性成功预测了化合物的物理性质。

相关学习资料:

 

[1] HASSAN AM,ALRASHDAN A,HAYAJNEH M T,et a1.Prediction of density,porosity and hardness in aluminum—copper-based composite materials using artificial neural network[J].Journal of Materials ProcessingTechnology,2009,209(2):894-899.

MORADI等通过人工神经网络(artificial neural network)和多重线性回归模型(multiplelinear regression model),以电解质浓度、温度和施加电压等反映参数作为模型的输入,成功预测了纳米介孔阳极氧化铝的介孔间距。

相关学习资料:

 

[1] AKBARPOUR H,MOHAJERI M,MORADI M.Investigationon the synthesis conditions at the interpore distance of nanoporous anodicaluminum oxide:A comparison of experimental study,artificial neural network,and multiple linear regression[J].Computational Materials Science,2013,79:75-81.

SCHERAGA等通过人工神经网络技术,在考虑多体极化效应的基础上,产生了液态水的力场,经过蒙特卡洛模拟(Monte Carlo simulation),与实验值十分吻合。

 

相关学习资料:

[1] CHO K H,NO K T’SCHERAGA H A.A polarizable forcefield for water using an artificial neural network[J].Journalof Molecular Structure,2002,641(1):77—91.

(5)  优化算法(optimization algorithm)

优化算法也已成为材料学家在化学空间中搜索新型复合物进行材料发现与设计的一种重要技术方法。常见的优化算法如遗传算法(genetic algorithm)进化算法(evolutionary algorithm)粒子群算法(swarnl particle algorithm)等均已被应用于寻找能量最低的稳定晶体结构。

WANG等运用差分进化算法(differential evolutionary algorithm)寻找低能量的稳定团簇结构,在耗费少量计算资源的情况下成功发现数十种钴单质团簇和铅单质团簇。

相关学习资料:

 

[1] CHEN Z,JIANG X,LI J,et a1.PDECO:Parallel differential evolution for clusters optimization[J].Journal of Computational Chemistry,201334(12):1046-1059.

HO等利用自适应遗传算法(adaptive genetic algorithm)发现了硅酸镁在分解过程中的多种相,并通过实验验证了这一发现。

相关学习资料:

[1] wu s Q,JI M,WANG C Z,et a1.An adaptive genetic algorithm for crystal structure prediction[J].Journal of Physics Condensed MaUer An Institute of Physics Journal,2014,26(3):doi:10.1088/0953— 8984/26/3/035402.

MA等开发了基于粒子群算法寻找能量最低结构的结构搜索程序CALYPSO,并成功 预测了高压条件下二氧化硅和碳酸钙的稳定相。

相关学习资料:

 

[1] WANG Y LU J,ZHU L,et a1.Crystalstructure prediction via particle swami optimization[J].Physics,2010,82(9):7174·7182.

 

尽管目前各种方法或方法组合在新能源材料研究领域都有成功的应用案例,但还远未达到材料基因组计划提出的初衷,主要表现在:

  • 系统性不强

 

当然这与材料基因组技术尚处于发展的初步阶段,还不能实现工具、手段、方法、数据、平台等的高度集聚和系统应用有关。

 

  • 各项技术发展还有待加强

 

① 对于性能要求非单一的材料研发,我们还不能完全通过计算来评估性能要求复杂的体系的材料性能;对于锂电池,其性能需要在各个方面优秀(容量、充放电速度、稳定性等),我们依然不能利用材料基因组高通量计算直观预测什么样的材料能做出来性能好的电池;

 

② 对于全新材料的研发,我们的目前材料搜索还是基于现有的晶体数据库,在现有已经可以制备的材料中寻找具有某些性能的材料,或者仅仅做一些类似于化学掺杂的工作,这样就很难有革命性的成果;

 

尽管现在已经有了一些利用遗传算法搜索材料结构的计算软件,但这些软件会消耗大量的计算资源,并且不能稳定地保证找到新的材料。目前尚没有利用这些软件进行高通量筛选的计算技术;

 

③对于实验的计算模拟,我们还不能通过材料基因组技术来预测实验过程,目前我们还没有成熟的计算模拟实验的方法,更多还是利用计算模拟对实验结果解释验证,需要融合高通量计算与高通量实验,发挥材料基因组技术的系统优势。

 

参考文献:林海, 郑家新, 林原, 等. 材料基因组技术在新能源材料领域应用进展[J]. 储能科学与技术, 2017, 6(5): 990-999.

原创文章,作者:菜菜欧尼酱,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2023/12/01/3b33dfa8cc/

(0)

相关推荐