背景介绍
抗生素耐药性在全球范围内呈上升趋势,以及微生物不可避免地会对新的化学结构产生抗药性,因此需要不断发现多种新的抗生素类别,而新抗生素开发周期通常需要10-15年。其中,共轭低聚电解质(COE)分子是一类新型抗生素候选物,但其复杂的结构、类似物的缺失和革兰氏类型的特异性等进一步加剧了挑战。机器学习(ML)可以提供一种简化开发的替代方法,从而确定分子结构中与抗生素活性最密切相关的基本元素。
然而,可能会为每个COE分子生成数以千计的描述符,因此需要开发一个有原则的向下选择过程,以便开发一个操作模型。分子特性的ML建模是通过应用ML的最新发展实现的,特别是关于深度学习和分子表示,而ML模型和分子表示方法可以紧密联系在一起。ML辅助抗生素特性预测中的许多方法都依赖于大型数据集,并专注于寻找与现有抗生素相似(即具有相同分布)的新候选抗生素。
成果简介
近日,美国麻省理工学院Tonio Buonassisi和Armi Tiihonen、新加坡国立大学Sarah J. Cox-Vazquez和Guillermo C. Bazan(共同通讯作者)等人报道了一种预测共轭低聚电解质(COEs)分子抗菌活性的模型,其中COEs是一类新的抗生素,但缺乏广泛的结构-活性关系研究。该模型可作为指导新预测COEs合成的咨询工具,其由四部分组成:(1)分子指纹表示;(2)特征向下选择;(3)ML模型配对;(4)描述符重要性分析。作者将该模型应用于一组136个COEs中,使用一个对分子域不可知的自动分子描述符向下选择过程。由此产生的指纹由21个分子描述符组成,其中40%以上与分子的三维(3D)形状有关。这与不依赖于形状的分子性质相关的描述符或与分子形状的低维简化相关的描述符形成对比,例如没有长度信息的分子键,与COEs的假定作用机制一致,即插入细菌膜。
图文速递
总结展望
综上所述,通过该预测模型,作者证明了ML确实可以帮助抗生素的开发,即使是关于潜在机制的信息很少,并且实验数据的可用性有限的候选者家族也有效。作者还证明在传统和复杂的ML模型中,分子代表性都会提高预测的准确性:它需要捕捉抗生素活性潜在机制的关键信息,以实现高预测准确性。
作者认为如果指纹针对研究中的分子域进行了优化,那么指纹识别仍然是一种有效的选择或学习表示的补充成分。最后,作者提出了一个域不可知框架来快速选择和分析分子指纹,以描述新型抗生素。在该工作中作者只研究了一类分子 COEs,但 3D 描述符在指纹向下选择中占主导地位表明能够捕获 3D 的表示和模型在其他抗生素候选域中也可能值得探索,尤其是当分子很大时 和作用机制与这里怀疑的分子形状有关。
文献信息
Predicting Antimicrobial Activity of Conjugated Oligoelectrolyte Molecules via Machine Learning.J. Am. Chem. Soc., 2021, DOI: 10.1021/jacs.1c05055.
原创文章,作者:科研小搬砖,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2023/10/13/c0c410c5b4/