Science:无监督机器学习,加速催化剂识别!

均质金属催化剂的形成是反应性、效率和选择性的关键决定因素。然而,决定核的因素(例如,单体与二聚体),有利的氧化态,以及催化剂的连接状态都常常很少被理解。例如,在广泛使用的钯催化交叉耦合中,将Pd(0)[P(t-Bu)3]2氧化加到芳甲基溴中会原位产生Pd(I)二聚体,当P(t-Bu)3被Ph2PH取代时,相同的Pd(I)二聚体转换为Pd三聚体。对于非贵金属物种(如Fe, Co, Cu或Ni催化剂)来说,这种物种形成挑战进一步加剧,对于这些物种,微妙的配体差异除了氧化状态和核外,还可能影响有利的自旋状态。显然,配体的性质对物种形成有重大影响。然而,每种配体影响的潜在来源很少被理解或预测。
在不深入了解配体和催化剂形态的相关性的情况下,新催化剂的开发在很大程度上依赖于反复试验或高通量筛选工作。前一种方法往往受到直觉的偏见,而后者取决于大型配体库的可用性或可访问性。任何进入未知配体空间的选择都将面临来自巨大结构可能性的选择挑战。因此,长期以来,人们一直有兴趣使用参数化来预测给定配体对有机金属络合物结构和反应性的可能影响,从而在可用配体空间中提供定性指导。
Science:无监督机器学习,加速催化剂识别!
德国亚琛工业大学Franziska Schoenebeck小组在Science上发文,Accelerated dinuclear palladium catalyst identification through unsupervised machine learning,通过无监督机器学习加速识别双核钯催化剂。钯(I)二聚体的稳定,依赖于非常小的磷化氢配体。使用机器学习来搜索这一类已知配体中的模式,从而指导发现同样稳定二聚体的变体,并合成了8个以前未报告的二聚体。
在机器学习方法中,所谓的“监督”和“非监督”算法代表了最常见的学习形式。在监督学习中,模型使用由输入-输出对组成的数据进行训练。监督学习对回归和分类任务特别有用,并已成功应用于催化背景下的选择性以及反应条件和产量。然而,需要大型训练数据集作为这种方法的先决条件,这在本文的(和许多其他)物种形成挑战中是无法提供的。
相比之下,非监督机器学习技术可用于识别数据集中的模式而无需使用标记数据对算法进行培训(因此无需已知输出,如实验)。学习过程提供的见解与传统分析截然不同,因为它们纯粹由“机器”派生,没有“人类”指导。聚类是无监督学习的主要领域之一,根据数据点的潜在相似性,数据分为几个组(集群)。
在这里,作者报告了一个仅使用五个实验数据点的非监督机器学习工作流程。它利用广义参数数据库,辅之以二氧化硅数据采集和聚类中特定问题。作者展示了这一策略对目前缺乏机理的钯(Pd)催化剂物种形成这一具有挑战性问题的有效性。该算法从总共348个配体中预测并实验验证了一些膦配体(包括以前从未合成过的配体),这些配体在更常见的Pd(0)和Pd(II)物种上具有双核Pd(I)络合物。
图文详情

Science:无监督机器学习,加速催化剂识别!

图1. 机器学习的设计思路

Science:无监督机器学习,加速催化剂识别!

图2. 数据生成和聚类

Science:无监督机器学习,加速催化剂识别!

图3. 预测与实验验证
文献信息
Hueffel et al., Accelerated dinuclear palladium catalyst identification through unsupervised machine learning. Science 374, 1134–1140 (2021).
https://www.science.org/doi/10.1126/science.abj0999

原创文章,作者:Gloria,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2023/10/18/7d2d56f152/

(0)

相关推荐