【数据挖掘】日本东北大李昊团队:电池固态电解质数据库的构建及应用

研究背景
全固态电池因为其安全性而备受关注,但传导离子在固态电解质中较低的离子电导率依然是阻碍其发展的一大障碍。特别是基于二价阳离子设计的全固态电池,阳离子与阴离子之间强的库伦引力导致阳离子更难迁移。目前,获得高性能的固态电解质依然面临很大的挑战。通过数据挖掘去理解物质结构和性能之间关系是一种新的应对方式。近日,日本东北大学(材料科学高等研究所,WPI-AIMR)李昊教授团队构建了一个动态的全固态电池电解质的数据库(dynamic database of solid-state electrolyte, DDSE)并对这个数据库进行了数据挖掘,讨论了固态电解质对不同价态阳离子传导的性质和发展历程。同时,作者基于这个数据库使用机器学习去预测离子电导率,高的R2表明这个数据库对研究固态电解质具有很好的潜力。值得注意的是,这个数据库可以接受用户的实验数据同以往报道的材料进行性能对比,并自动分析新材料的活化能排名基于此,这个数据库在今后有望成为一个标准的对比库。
图文导读
目前,这个动态数据库收录了近40年的745种材料(截至最近更新时间),其中包括基于多种一价和二价阳离子(即Li+, Na+, K+, Ag+, Ca2+, Mg2+ 和 Zn2+)的固态电解质材料。作者总结了材料的多种信息(如活化能,离子传导率,相变信息,材料类别,材料报道时间和文献来源等)。控制数据库界面左边的操作板可以将各种材料之间的信息可视化(如图1所示),能够更加清晰地反映材料结构和性质之间的关系。数据库主页提供了使用说明以及视频演示,更多功能演示可以参考数据库主页(数据库永久DOI:http://doi.org/10.50974/00137195;直接访问URL: https://ssbed-ssbed-database-gui-ntj1tz.streamlit.app/)。
【数据挖掘】日本东北大李昊团队:电池固态电解质数据库的构建及应用
图1 数据库界面
基于这个数据库,作者进行了数据挖掘。图2清晰地展示了固态电解质研究随时间逐年递增,特别是近10年来,固态电解质的研究受到越来越多的关注。同时,作者分析了在当前数据库中,一价和二价阳离子在各种固态电解质中的离子电导率分布。图3展示了基于各种价态阳离子设计的固态电解质的传导性能。所有固态电池的研究中,Li基固态电池的研究数量远多于其它金属固态电解质,其材料的log10(σ)(σ为离子电导率)大都集中-4至-2 log10(S/cm)。其次是Na基电池材料,这类材料的log10(σ)主要分布在-3到-1 log10(S/cm)。对于二价金属离子,其在性能和数据总量上在整体上都明显低于一价金属离子。造成这个现象的可能原因是:相比于一价离子,二价离子和其抗衡离子间存在更强的库伦引力,而这个库伦引力会阻碍阳离子的迁移。
【数据挖掘】日本东北大李昊团队:电池固态电解质数据库的构建及应用
图2 数据库报告材料数量统计(截至2023年5月)
【数据挖掘】日本东北大李昊团队:电池固态电解质数据库的构建及应用
图3 基于DDSE数据库总结的SSE材料的阳离子电导率性能(单位:S/cm)
横轴表示log10(σ),单位为log10(S/cm)。相对数量(不带单位)表示相应范围内物质的数量。
最后,作者对这个数据库中的数据进行分组(一价阳离子组、二价阳离子组、所有材料),然后分别用机器学习去描述材料的离子电导率,并使用SHapley Additive exPlanations (SHAP)模块对特征进行了定量分析,结果如图4所示。基于这三组数据进行机器学习建模,作者将数据按照1:4拆分成测试集和训练集。从构造的一系列特征中,通过Pearson方法和特征重要性评估,确定了最重要的八个特征去描述不同分组材料的离子电导率。通过十折交叉验证得到了很好R2(一价化合物,R2= 0.92;二价化合物,R2= 0.86;全部化合物,R2= 0.92)。对比SVR (support vector machine), RFR (random forest regression), 和GBR (gradient boosting regression)三种方法模型化目标,结果表明GBR方法得到的结果最优。文章中使用8个特征提高了计算速度,同时保证了模型的准确性。
【数据挖掘】日本东北大李昊团队:电池固态电解质数据库的构建及应用
图4 采用GBR算法进行ML建模,并基于DDSE数据进行特征分析
(a, e, i) (a) 单价、(b) 二价和 (c) 数据库中所有材料的模型训练集结果。(b、f、j)基于(b)单价、(b)二价和(c)数据库中所有材料的测试集结果。(c, g, k) 基于 (c) 单价、(g)、二价和 (k) 所有材料的数据得出的特征重要性。(d,h,l)基于(d)单价,(h)二价和(l)所有数据的数据计算出特征的SHAP值(即对模型输出的影响)
总结展望
通过数据挖掘,分析了固态电解质的发展趋势,讨论了不同导电离子的性能差异,这些结果对开发新的高性能材料具有实际指导意义。基于这个数据库执行机器学习去预测离子的电导率可以获得很好的R2值,表明使用数据库去研究开发新的高性能材料是极具潜力的。另外该数据库提供的数据比对功能,将会为实验上合成的新材料提供性能参考。在未来,随着数据库中收录材料的增加,数据库功能的更加完善。该数据库会为新材料的设计和开发提供更多有用的信息。
文献信息
F. Yang, E. C. D. Santos*, X. Jia, R. Sato, K. Kisu, H. Yusuke, S. Orimo, and H. Li*, “A Dynamic Database of Solid-State Electrolyte (DDSE) Picturing All-Solid-State Batteries”, Nano Materials Science (IF: 9.9), 2023.
https://www.sciencedirect.com/science/article/pii/S258996512300034X

原创文章,作者:MS杨站长,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2023/09/26/584e4fff2c/

(0)

相关推荐