传统材料研发模式主要基于实验“试错法”,其研发周期长、效率低,人工智能驱动的科研范式变革和新材料数字化研发模式能有效地降低研发成本,缩短研发周期。
提到工业软件, 人们往往想到的都是基于宏观有限元的模拟仿真软件。然而, 很多时候, 新材料数字化研发, 仅需有限元尺度是不够的,还需要深入到电子、原子和分子尺度, 其理论基础主要包括量子力学和分子动力学等,我们可称之为微介观尺度材料计算模拟。目前,在国内,微介观尺度材料集成计算软件基本被某国外软件所垄断,尽管该软件并不支持高通量多尺度自动化流程,但是国内大多数用户仍使用它进行建模并开展计算,据悉目前该软件已开始对我国一些单位禁用。
人工智能驱动的科研范式AI for Science 给新材料数字化研发带来了新的机遇和挑战。尽管对“弯道超车”一词有不同的看法,就新材料研发而言,借助于不断强大且成本不断降低的高性能计算算力、数据传输能力、数据存储能力等,通过大数据、云计算、人工智能以及日益增多的围绕材料设计和性能预测的各种智能算法和模型,开展计算、数据、AI 和实验紧密结合的“四位一体”的“理论设计在前,实验验证在后”的材料数字化研究方法、业态和模式,可变革仅基于实验“试错法”的传统单一研发手段,进而有效降低成本,提高研发效率,实现对新材料研发的“弯道超车”。
▲ 高通量材料计算驱动引擎的要素整合
高通量材料计算驱动引擎有效地整合了算法、算力、数据和知识
以电极材料为例,目前锂电池负极材料,90%以上还是石墨材料,而石墨的电池容量,目前已接近极限值。我们需要寻找下一代锂电池负极材料。除了容量特性外,扩散势垒、平均开路电压、电导率、稳定性、电荷性质等,都会影响该负极材料的设计。这些负极材料的关键物性,大多可以直接或间接地计算出来。比如我们可以开发基于容量和扩散势垒筛选等的工作流模板,让这些模板从已知的晶体结构数据库中,选出合适的候选材料进行吸附等调控操作,生成大量的候选结构,形成搜索空间,通过高通量计算驱动引擎连接超算中心,借助强大算力,对搜索空间中的候选结构按目标物性进行流水线式的自动筛选。基于得到的理论计算结果,构建相关人工智能模型,开展实验对接和验证,进行理性设计,可以加快材料的研发速度,降低成本,而所付出的代价只是机时成本。
美国QuesTek 工程师采用集成计算材料工程(integrated computing materials engineering,ICME) 方法研制M54 钢,从研发设计到美国海军军用飞机的应用部署,只用了6 年的时间,相较于从研发到应用平均15 年的时间,研发周期缩短了60%。他们基于该方法研究的C64 新型高性能钢,可用于制造更耐用、更轻的变速器齿轮,增加功率密度。这种设计和商业化的成功,使它获得了2021 年ASM 国际工程材料成就奖。
▲ “建模、计算、数据、AI”的自动流水线模式
采用如图所示模式开展材料计算、物性提取和机器学习,能极大地提高效率,尤其是对于材料的高通量计算筛选
然而,对于企业级新材料研发,面临着如何避免数据碎片化,整合、研发或改进新材料研发生命周期过程中的离散数据、代码、模型和算法等,从而实现团队共享的问题;面临着如何将高通量计算、高性能计算、机器学习等材料信息学方法和技术更好地与实验相结合加快新材料研发等问题。对于面向科研的材料计算,面临着如何不需要下载、安装、编译软件,不需要担心计算集群和机时,直接采用浏览器开展计算,计算完毕直接形成数据库的问题;面临着课题团队的机时、存储、作业、任务、数据等的集中统一管理问题。对于这些新材料数字化研究和开发的诸多问题,我国不仅缺少相关技术和平台,更缺乏专门的书籍进行介绍。
《高通量多尺度材料计算和机器学习》(北京:科学出版社, 2023.8)作者杨小渝研究员曾在英国剑桥大学从事博士后研究,现为中科院计算机网络信息中心“百人计划”A 类研究员,中国科学院大学岗位教授,拥有10 多年的高通量材料集成计算、多尺度计算模拟、材料数据库、材料信息学等软件和集成平台研发经验和成果积累。作者承担了“十三五”国家重点研发计划“材料基因工程重点专项”课题“高通量材料计算大数据处理技术”(2016YFB0700501),研发了高通量多尺度材料集成设计工业软件MatCloud,并实现了开放应用,是我国在该领域的优秀科学家。
谢建新
北京科技大学教授
中国工程院院士
2023 年7 月
作者于2000 年赴英国攻读计算机及应用专业硕士和博士,2005 年博士毕业后前往英国剑桥大学地球科学系开展e-Science 博士后研究,在那里开始接触材料计算和材料信息学,其间发表了10 余篇有关材料计算和数据基础设施建设的论文及3 部专著。2011 年6 月美国材料基因组计划的提出引领了新材料研发范式的变革,作者便于2012 年回国带领团队从事材料基因工程高通量材料计算和数据库平台的研发。当时高通量材料计算尚属前沿技术,在中国科学院计算机网络信息中心的支持下,从“0”到“1”,我们研发了当时国内首个高通量材料计算和材料数据库云平台MatCloud,并于2015 年上线运行(见中文核心期刊《科技导报》,2016, 34(24): 62-67)。2018 年MatCloud 成功实现了成果转化(MatCloud+)。经过10 多年的持续研发和迭代,MatCloud 已100%商业化落地,它以高通量、多尺度、云原生、图形化等为特点,实现了材料计算的“建模→ 计算→ 数据→AI”全流程和云端自动化,基本可实现对国外同类软件的替代。
▲ MatCloud+的核心模块和交互
截至2023 年6 月,全球注册用户已突破6000,涵盖300 多家高校、科研院所和企业,覆盖10 多个国家和地区,已举办线上线下各类培训近100场,培训用户数累计近3500 人次,取得了较好的社会与经济效益,得到北京市科学技术委员会的高度关注与支持。目前,国际上真正实现了高通量多尺度材料计算的云平台主要有美国的Mat3ra (www.mat3ra.com) 和韩国的Materials Square(www.materialssquare.com) 。作为中国高通量多尺度材料计算云平台的卓越代表,MatCloud(www.matcloud.com.cn) 的部分功能已超越Mat3ra 和Materials Square。
MatCloud 研发得到了国家自然科学基金项目“材料基因组计划高通量材料集成计算关键技术和服务平台研究”和科技部“十三五”国家重点研发计划“材料基因工程重点专项”课题“高通量材料计算大数据处理技术”的支持,也是“十三五”材料基因工程重点专项“材料基因工程关键技术与支撑平台”的代表性成果之一,取得的一系列研究及应用成果相继在Scientific Data(Nature子刊)、Computational Material Science(IF3.3, JCR Q1)、Nanoscale(IF 7.79,JCR Q2)、Electrochim Acta(IF 6.901, JCR Q2)、Carbon(IF 9.593, JCR Q1)、Chinese Physics B(IF1.494/JCRQ3) 等多个国际国内知名期刊发表。
为了让从事新材料研发和创新的研究人员更加清晰地把握高通量多尺度材料计算和机器学习,作者于2016 年萌生了出版高通量材料计算专著的想法,2017年开始撰写,历时4 年,几经打磨,于2021 年完成近40 万字的初稿。2022 年获得国家科学技术学术著作出版基金的资助,经进一步修改和完善最终定稿。(杨小渝著. 北京:科学出版社, 2023.8)一书提出了基于材料基因编码的新材料智能设计范式,从企业级新材料研发和面向科研的材料计算视角,讲述了高通量材料集成计算与新材料智能设计。
重点围绕如何通过计算与数据的集成、计算数据与实验数据的集成、高通量计算与多尺度模拟的集成以及数据与AI 的集成,促进基于计算、数据、AI 和实验“四位一体”的“理论设计优先,实验验证在后”的新材料研发新业态、新模式和新文化。从高通量材料集成计算、多尺度材料计算模拟、材料数据库、材料数据机器学习、新材料研发制造软件等介绍了新材料数字化研发基本概念、方法、技术及国产的新材料研发集成设计工业软件MatCloud+,并以一些案例介绍这些数字化研发方法和技术在重点材料行业的应用。
《高通量多尺度材料计算和机器学习》具有物理、材料、化学和计算机等多学科交叉的鲜明特点。作者从基本概念和基本理念讲起,提出了基于材料基因编码理念的材料智能设计新范式,阐述了高通量计算、高通量材料计算、高通量计算环境、高通量材料计算驱动引擎、材料基因数据库、材料基因编码挖掘、材料设计软件等内容,深入浅出,适合于有意向开展或了解高通量多尺度材料计算、材料数据和机器学习的高校、科研院所和企业等层面的读者群体。 张统一 中国科学院院士 2023 年7 月18 日
本书的出版,得到了国家科学技术学术著作出版基金(2022) 的资助,也得到了国家自然科学基金面上项目(2014)、国家自然科学基金重点项目(2015)、“十三五”国家重点研发计划“材料基因工程重点专项”(2016,2017,2018)、云南省“稀贵金属材料基因工程”重大科技专项(2018)、国家自然科学基金专项“面向2035 的材料设计制造工业软件战略研究”(2021)的支持。
本文摘编自《高通量多尺度材料计算和机器学习》(杨小渝著. 北京:科学出版社, 2023.8)一书“前言”“序一”“序二”,有删减修改,标题为编者所加。
(本文编辑:刘四旦)
原创文章,作者:计算搬砖工程师,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2024/04/02/d93737be75/