【机器学习+材料】Nat. Rev. Mater.:AI解放人类双手,加速实现新材料的研发

【机器学习+材料】Nat. Rev. Mater.:AI解放人类双手,加速实现新材料的研发
主动学习和自动化是否可以将人类从实验室工作流程中解放出来?在真正影响材料的研发之前,人工智能系统可能需要精确的设置,以确保其强大的运行能力,以及处理认知和随机错误的能力。随着自主实验的广泛应用,如何在自主实验室的设计中嵌入可重复性、可重构性和互操作性是至关重要的。基于此,麻省理工学院Tonio Buonassisi和Ju Li等人在Nature Reviews Materials发表Comment文章,提出了两个观点:解决认知错误与构建互联的人工智能实验室。
研究背景
新材料的发现是一个劳动密集型的过程,正如爱迪生为了发明白炽灯泡测试了数千根灯丝。如今,结合机器人和主动学习的自动化模式出现了。在预算和空间有限的情况下,构建完全自动化的实验平台是具有挑战性的,但却可以尝试从半自动化的工作流程上进行(如在仪器之间手动转移样品阵列)。使用高斯过程回归和贝叶斯优化及其变体的主动学习方法,已经可以出色地管理多种类型的过程优化。
正如养育孩子需要几十年的时间和不同种类的课程一样,我们不应该期望在有限的知识基础上进行主动学习驱动的实验。教一个蹒跚学步的孩子走路需要大量的握手和交流,人们应该期待主动学习和人工智能(AI)驱动的实验也是如此——即使有一个看似强大的自动化管道,也需要大量的外部指导。
【机器学习+材料】Nat. Rev. Mater.:AI解放人类双手,加速实现新材料的研发
图1:在AI网络中的自主实验室。随着AI系统能力的不断增强以及预算和物理空间的限制,采用模块化云实验室设施可能是有利的。这些可以在一些荒地上进行大规模实施。这些设施允许灵活的重新配置和设备链的互连,确保跨多个自主实验室的互操作性。数字流和质量流是两个最关键的流:多个AI代理通过统一的网络交换信息,而在物理领域,许多轮式机器人和无人机作为物理样本运输的推进剂。来自全球任何角落的研究人员都可以远程访问该系统,他们以人类语言给出的命令可以被解析成子任务,并通过大型语言模型进行分发。
解决认知错误
获得长期可重现数据集的能力是一个成熟的机器人平台有资格进行主动学习的标志。当一个实验重复两次并产生不同的结果时,这种差异来自两个来源:偶然误差和认知错误。偶然误差源于随机性,由于可以通过自动化来消除,并且可以通过高斯过程噪声核来推断,因此更容易处理。相反,认知错误可能会对由主动学习算法驱动的自主实验造成严重破坏。例如,在机器人平台上,有一段时间,研究人员会发现从一个简单的自动化液滴铸造过程中制备的碳纸基样品的性能有很大的变化。这个问题没有得到解决,直到研究人员注意到碳基板可能是各向异性的,这意味着切割碳基板的方式是一个重要的变量。
有人可能会问,为什么可重复性对主动学习特别重要。做手工实验的实验者不也面临这个问题吗?答案是肯定的,但人类丰富的经验和流体智力大大减轻了这种担忧。想象一下,一个学生发现了一个合成配方,重复了10次,10次中有2次得到了非常令人兴奋的结果。学生将做什么?误差条太大,无法公布结果,因此学生会和指导老师讨论,以多种方式调整设置,最终找出统计异常背后的原因(例如,可能是中间反应产物的多余水分含量)。
统计异常源于我们无法识别导致结果的所有潜在变量,如果它们被忽视而不去做调研,就会导致不可重复性。《自然》杂志的一项调查显示,文献中不可复制的主要原因是选择性报道。如果一个人在不确定误差条的来源的情况下鲁莽地启动一个主动学习项目,那么这种努力可能会浪费大量的时间和金钱。该算法会错误地将虚假噪声视为信号,从而给出糟糕的建议,就类似于“无效输入,无效输出”。
另一面是,如果仔细纠正认知错误,可能会导致奇妙的科学发现(例如,青霉素的发现是由于未能培养出意外受到真菌污染的细菌培养物)。人类非常擅长扭转“实验失败”,因为我们有非凡的因果推理能力(“一旦你排除了不可能,剩下的,不管多么不可能,一定是真相”,引用夏洛克·福尔摩斯的话)。这与基本的主动学习方法不同,因为它们对世界的看法过于简单,没有太多的先验物理知识。
与传统的机器学习技术不同,像ChatGPT这样的大型语言模型可以用来生成完备的科学假设。在未来,将使用更广泛和更深入的实验室自动化来实验测试这些机器生成的假设,这可能能够解释认知错误。例如,一个合成过程可以在不同的可控大气室中自动化地重复,以了解不同气体对分压的依赖。计算机视觉领域也逐渐融入了自动化的实验,计算机视觉在某些任务上的表现已经超过了人类的视觉,计算机视觉能够比人类更细致地跟踪实验室条件(如湿度、辐射背景、材料的纹理和不均匀性),并且有了一个关于物质世界如何运作的庞大的先验知识库,具有多模态传感器的AI系统能够找出认知错误的合理原因并通过实验调试工作流程只是时间问题。大型语言模型加上具有广义感觉运动功能的强化学习和下面描述的“新控制论”可能是实验室自动化革命的下一个阶段。
走向互联的人工智能驱动实验室
随着AI系统变得越来越复杂和强大,在预算和空间上限制就要求人类必须使用模块化云实验室设施(如图1所示),以便设备链可以重新编译和重新链接,并确保多个自主实验室之间的互操作性。这就需要一个AI网络系统,包括实验和理论,来实现劳动分工、经济规模化和制衡系统。
当今用于材料合成、表征和性能测试的商用设备在设计时只考虑到人类用户。未来,自主实验室将要求每个设备都有两个接口,一个是物联网AI系统的主接口,另一个是人类访问接口。每个设备的操作类似于软件库中的子程序,具有严格定义的物理样本的输入/输出规范。模块化设备的柔性链将被设计成能够快速、自动地重新配置(拆卸和重新组装)。值得注意的是,可重构性并不总是需要物理移动设备来形成装配线,因为轮式机器人和小型飞行无人机可以用来在模块之间转移样品。
尽管自20世纪50年代以来,人们就设想并开发了自主材料发现实验室,但迄今为止,真正的成功相对较少。在学术机构,建立每个实验室的预算被限制在几百万美元或更少。这意味着对识别认知错误和在应对工作流程中的快速变化时准备不足。人类一旦怀疑有什么不寻常的东西,可以离开他们的舒适区,让同事在校园的不同设施之间走动,进行补充测量,而今天的自主实验室仍然往往太小,还不具备这种灵活性。
为了克服这个问题,自主实验室需要共同努力。我们需要允许AI代理通过通用的样本传输和数据传输程序相互通信。这将允许自治实验室A将物理样本发送到自治实验室B,并附带相关的元数据。也需要开发用于转移液体、粉末、凝胶、颗粒和单晶材料的标准化胶囊,它们需要与易于称重和加工、光学和化学表征的技术兼容,并且需要防止污染。我们还需要专门为灵活自动化设计构建基础设施,可以为机器人和人类研究人员的一起工作构建全新的架构。
AI时代已经来临。为了充分释放AI在实验研究和材料发现方面的潜力,为硅基智能配备“手”(材料合成、设备自组装/拆卸和样品转移)和“眼”(材料表征和多模态传感)至关重要。构建一个强大的AI系统实现对现实世界的反馈当然不是一件容易的事。但是,随着AI实验室的建立和相互连接,以及标准化接口和硬件模块中的专有技术在全球范围内广泛共享,强大的AI支持的灵活而强大的实验工作流程可能会彻底改变材料研究。
文献信息
Zhichu Ren, Zekun Ren, Zhen Zhang, Tonio Buonassisi & Ju Li. Inverse Autonomous experiments using active learning and AI. Nature Reviews Materials (2023).
https://doi.org/10.1038/s41578-023-00588-4

原创文章,作者:计算搬砖工程师,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2024/01/26/436a9f3fc3/

(0)

相关推荐