npj Comput. Mater.: 深度学习方法在材料科学中的最新进展和应用

npj Comput. Mater.: 深度学习方法在材料科学中的最新进展和应用
深度学习(DL)是材料数据科学中发展最快的主题之一,其应用领域包括原子数据、基于图像的数据、光谱数据和文本数据等。DL允许分析非结构化数据和自动识别特征,大型材料数据库的最新发展推动了DL方法在原子预测中的应用。相比之下,图像和光谱数据的进步在很大程度上利用了高质量正向模型及生成无监督DL方法支撑的合成数据。
npj Comput. Mater.: 深度学习方法在材料科学中的最新进展和应用
在此,美国国家标准与技术研究院Kamal Choudhary等人概述了深度学习(DL)方法中的一些基本原理,然后详细讨论了DL在原子模拟、材料成像、光谱分析和自然语言处理等领域的最新发展。首先,作者介绍了通用的机器学习概念。然后,详细介绍了神经网络、卷积神经网络、图神经网络、序列到序列模型、生成模型、深度强化学习及科学机器学习等DL方法。
此外,需要材料科学特定考虑因素的成功DL应用的某些方面包括:
1)获取大型、平衡和多样化的数据集(通常大约10000个数据点或更多),
2)确定适当的DL方法和输入样本的适当向量或图形表示,
3)选择与科学目标相关的适当绩效指标。作者讨论了一些材料科学的关键领域,其中DL已应用到存储库和数据集的可用链接,这些链接有助于工作的可重复性和可扩展性。
npj Comput. Mater.: 深度学习方法在材料科学中的最新进展和应用
图1. 光谱数据深度学习的示例应用
尽管DL方法在材料设计方面有各种令人着迷的机会,但也有一些局限性和挑战:
(1)仅基于化学式的材料表示不考虑结构,这一方面使其更适合用于无法获得结构信息的新化合物,但另一方面也无法捕获相变等现象;
(2)基于原子图的预测虽是完整的原子描述,但仅在散装材料上进行了测试。这强调了输入特征必须对输出标签具有预测性,且不能丢失关键信息;
(3)在图像和光谱方面,大多数时候实验数据过于嘈杂,在应用DL之前需要进行大量操作;
(4)DL的不确定性量化很重要,但该领域仅发表了少数作品,亟需提高其可解释性;
(5)虽然训练-验证-测试拆分策略主要用于具有一定数量的图像分类任务,但对于回归模型可能不是最好的方法;
(6)在自动实验室中实现闭环自主材料设计和合成过程,包括机器学习和实验组件,这仍是一个重要的技术挑战。
npj Comput. Mater.: 深度学习方法在材料科学中的最新进展和应用
图2. 基于深度学习的原子位点分类算法
Recent advances and applications of deep learning methods in materials science, npj Computational Materials 2022. DOI: 10.1038/s41524-022-00734-6

原创文章,作者:v-suan,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2023/10/13/ad1fa1f2f4/

(0)

相关推荐