金属和连接体的选择共同决定了金属-有机骨架(MOF)的结构和客体可及性,但大量可能的金属-连接体组合使得合成组分的选择具有挑战性。在此,利物浦大学Matthew J. Rosseinsky等人利用机器学习(ML)来帮助化学家从最早的材料设计阶段确定可用选项的优先级,在这个阶段,只有有机配体和合成组合的金属物种的化学特性是已知的,以便确定最有可能提供高客体可及性MOF结构的金属-连接体组合。为了实现这一目标,首先,作者从剑桥结构数据库 (CSD) MOF子集中获得了一个将3D MOF结构连接到其化学骨架成分(即金属和连接体)的数据集。然后,评估了各种ML模型以了解组分化学和MOF特性之间的联系,而无需明确要求对MOF结构有经验知识。图1. 创建1M1L3D数据集及ML模型的工作流程作为说明性示例,作者构建了1M1L3D 数据集,由3D连接的仅由单一金属和单一连接体物种组成的MOF网络构建而成,并将其用于训练随机森林模型。该模型成功预测由给定金属-连接体组合产生的这种类型MOF的可及性,准确率为80.5%。此外,还生成了两个额外的ML模型,分别用于预测孔隙是小、中还是大。这些ML方法提供了简单的指导,根据生成客体可及性MOF的可能性以及潜在孔隙尺寸与吸附、分离和催化应用所需尺寸的匹配,为合成探索的候选金属-连接体组合的优先排序提供参考,目的是加速发现超出当前结构数据库的开放框架MOF结构。图2. ML基于其连接体和金属成分预测候选MOF可及性的准确性Machine Learning Prediction of Metal-Organic Framework Guest Accessibility from Linker and Metal Chemistry, Angewandte Chemie International Edition 2021. DOI: 10.1002/anie.202114573