自主实验室,可以加速化学合成的发现,但这需要自动化测量和可靠的决策。大多数自主实验室都使用定制的自动化设备,反应结果通常使用单一的硬连线表征技术进行评估。
然后,任何决策算法都必须使用这一狭窄范围的特征数据进行操作。相比之下,人工实验倾向于利用更广泛的仪器来表征反应产物,并且很少仅根据一次测量来做出决定。
在此,来自英国利物浦大学的Andrew I. Cooper等研究者展示了通过使用移动机器人来操作设备并以类似人类的方式做出决策,可以将合成实验室集成到一个自主实验室中。相关论文以题为“Autonomous mobile robots for exploratory synthetic chemistry”于2024年11月06日发表在Nature上。
2023年中国科学院外籍院士共新当选 30 名中国科学院外籍院士,其中来自英国利物浦大学的安德鲁·库伯 (Andrew I. Cooper) 教授是 Chemical Science 期刊的主编。
自动化机器人实验室有潜力改变研究者对化学合成的方式,但要实现广泛应用仍面临障碍。自治不仅仅意味着自动化;它要求通过代理、算法或人工智能来记录和解释分析数据,并根据这些数据做出决策。这是自动化实验和自治实验的关键区别:在自动化实验中,研究人员做出决策,而在自治实验中,决策由机器完成。
自治实验的有效性取决于分析数据输入的质量和多样性,以及它们随后的自主解释。探索性合成中的决策自动化非常具有挑战性,因为与催化某些领域不同,它通常不涉及对单一性能指标的测量和最大化。
例如,超分子合成可能会产生各种可能的自组装反应产物,这从自动化的角度看是一个更开放的问题,而不是简单地最大化已知目标的产率。探索性合成在没有简单定量“新颖性”或“重要性”指标的情况下,较难应用闭环优化策略。
在手动探索性合成中,反应通常会通过多种技术进行表征,以确保化学物种的明确识别。例如,在小分子有机合成和超分子化学中,质谱(MS)和核磁共振(NMR)谱通常结合使用,分别用来探测分子量和分子结构。将这些多模态分析数据自动化以指导合成发现过程并非易事。
基于人工智能的方法,由于受限于其训练数据,可能通过过于依赖已有的先验知识而妨碍真正的新发现。同样,基于规则的决策方法也需要小心实施,否则可能忽视偏离规则的化学现象。从更根本的角度来看,合成的多样性导致了表征数据的多样性。
例如,某些化合物可能在质谱中显示简单的信号,但在NMR中呈现高度复杂的谱图,而其他化合物则可能表现出相反的行为,甚至可能完全没有质谱信号。作为化学家,研究者会根据具体情况做出常规的决策,决定关注哪些数据流,但这对于自治系统来说是一个重大障碍。
在多样化自动化合成平台和提高其自治能力方面已经取得了很大进展。目前,大多数平台采用定制工程和物理集成的分析设备。与此相关的高成本、复杂性和分析设备的近乎垄断意味着,自动化工作流中往往偏向使用单一的固定表征技术,而不是利用大多数合成实验室中可用的更广泛的分析技术。
这迫使任何决策算法在有限的分析信息下进行操作,而不像更多元化的手动方法那样。因此,闭环自治化学合成在所需的实验室基础设施和决策步骤上,往往与人类实验没有太多相似之处。
研究者之前展示过,移动机器人可以融入现有实验室,模仿人类科学家的物理操作来进行实验。然而,那一工作流仅限于一种特定类型的化学反应——光化学氢气演化,并且唯一可用的测量方法是气相色谱,这只提供简单的标量输出。
后续的研究也集中在移动机器人优化催化剂性能上。这些台式催化工作流无法进行更一般的合成化学实验,例如涉及有机溶剂的反应,也无法测量和解释更复杂的表征数据,如NMR谱图。算法决策仅限于最大化催化剂性能,这类似于通过NMR或色谱峰面积最大化反应产率的自治合成平台。
在此,研究者展示了一个模块化的自治平台,用于通用的探索性合成化学。该平台使用移动机器人操作Chemspeed ISynth合成平台、超高效液相色谱-质谱联用仪(UPLC-MS)和台式核磁共振(NMR)光谱仪。这个模块化实验室工作流具有内在的可扩展性,可以根据需求增加其他设备,如此处所示,通过添加一个标准的商用光反应器。
此外,为了应对广泛的化学目标,研究者开发了一个启发式决策器,用于处理正交的NMR和UPLC-MS数据,从而无需人工干预,自动选择成功的反应进行进一步研究。该决策器还会在放大反应之前检查反应筛选结果的重现性。
合成-分析-决策周期模仿了人类实验的协议,能够自主决定后续的工作流步骤。研究者通过结构多样化化学和超分子主客体组装的自治识别来展示这一方法。尽管合成过程是自治的,但化学选择并非如此:反应和构建块是在实验之前由领域专家选定的。
尽管如此,这依然为决策器提供了广泛的反应空间。在此基础上,研究者将这一自治方法进一步拓展至功能评估,通过自主评估成功的超分子合成的主客体结合特性,验证了该方法在合成之外的应用。
图1 模块化机器人工作流和启发式反应计划器。
图2 自主发散合成。
图3 自主发现超分子主客体系统。
图4 在模块化、分布式工作流程中增加一个光反应站。
综上所述,研究者提出了一种利用移动机器人整合分布式合成和分析平台的探索性合成化学策略。尽管这些工作流程不是闭环优化,它们通过自主决策加速了发现过程。与人类研究者相比,算法的决策几乎是即时的,从而加速了实验进程。
该系统能够自动选择成功的反应进行进一步研究,并检测反应的可重复性,但仍需人工后期分析以确认结果。例如,在超分子筛选中,某些反应虽满足算法筛选标准,但在质谱中未通过,揭示了规则基础的搜索方法的局限性。
该方法能够处理复杂的液体添加和有机溶剂,以及更复杂的数据流,适用于多样化的化学反应。该启发式决策方法能够结合UPLC-MS和NMR数据,为合成化学问题提供解决方案,且比黑箱式机器学习模型更适用于数据稀缺的复杂问题。此方法具有可扩展性,未来可拓展至工业实验室。
Dai, T., Vijayakrishnan, S., Szczypiński, F.T.et al. Autonomous mobile robots for exploratory synthetic chemistry. Nature (2024).
原创文章,作者:zhan1,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2024/11/07/86c11591af/