在药物和材料设计领域,优化候选分子的理化和功能特性是一个至关重要的任务,因其直接关系到药物的有效性和安全性。然而,在多目标优化过程中,平衡多个可能相互冲突的目标一直是一个巨大的挑战,尤其是缺乏多属性标注的训练数据使得传统人工智能方法的应用受到限制。
为了解决这一问题,浙江大学吴振兴,谢昌谕、侯廷军以及中南大学曹东升团队联合在Nature Machine Intelligence期刊上发表了题为“Leveraging language model for advanced multiproperty molecular optimization via prompt engineering”的最新论文。论文指出,Prompt-MolOpt是一种利用大语言模型中的嵌入技术来优化分子的工具。作者通过引入基于提示的嵌入,Prompt-MolOpt不仅能够在有限的多属性数据下进行有效的分子优化,而且在零样本情况下也表现出良好的泛化能力。
在与现有模型(如JTNN、hierG2G和Modof)的比较中,Prompt-MolOpt在多属性优化的成功率上超越了传统方法,特别是在保持药效团或用户指定的片段方面显示出更强的灵活性。此外,Prompt-MolOpt通过构建针对特定领域的优化数据集,成功地引导分子优化向相关化学空间推进,提升了优化分子的质量。这些研究结果不仅为化学研究提供了新的工具,也为药物和材料的发现开辟了新的路径,展示了在复杂优化任务中应用AI的巨大潜力。
(1)本文首次提出了Prompt-MolOpt工具,利用基于提示的嵌入技术,显著提升了分子在特定属性调整方面的优化能力。通过借鉴大语言模型的框架,Prompt-MolOpt能够有效处理有限的多属性数据,即使在零样本情况下也能成功泛化从单属性数据集中学到的因果关系。
(2)实验通过与现有模型(如JTNN、hierG2G和Modof)的比较评估,Prompt-MolOpt在多属性优化成功率上实现了超过15%的相对提升,显示出其在分子优化领域的优越性。此外,Prompt-MolOptP变体能够在结构转化过程中保留药效团或用户指定的片段,这一特性扩展了该工具的应用范围。
(3)本文通过构建针对特定领域的优化数据集,Prompt-MolOpt成功引导分子优化向相关的化学空间发展,提高了优化分子的质量。实际案例(如血脑屏障通透性优化)进一步验证了该工具的实际应用价值。综上所述,Prompt-MolOpt为多属性和多靶位分子优化提供了灵活的方法,展现了其在化学研究及药物和材料发现中的广泛潜力。
图1: Prompt-MolOptP的多属性和多位点BBBP优化实例研究。
图4: Prompt-MolOptP分子优化框架概述。
本研究通过引入Prompt-MolOpt,展示了将变换器架构与提示学习相结合的创新思路,为多属性分子优化提供了新的可能性。该方法不仅允许研究者在优化过程中灵活指定需要保留的分子结构,还通过与领域专家的互动,增强了人工智能在药物设计中的实用性。这种协作模式突显了跨学科合作的重要性,表明AI技术的成功应用依赖于专业知识的支持。
此外,Prompt-MolOpt在零样本学习中的表现,显示出该方法在数据稀缺条件下的潜力,突破了以往模型对大量标记数据的依赖。这一发现为未来的分子优化研究开辟了新方向,尤其是在真实世界应用中,如改善药物的生物利用度和安全性。同时,研究中提出的构建领域相关数据集的方法,为定制化的分子优化提供了切实可行的路径,强调了针对特定应用的优化策略。
然而,研究也指出了当前方法在整合靶点信息和处理手性等方面的不足,未来的研究应继续探索这些挑战,进一步提升分子优化的有效性和适用性。这些启示不仅推动了化学和药物开发领域的发展,也为其他科学研究领域的技术应用提供了借鉴。
Wu, Z., Zhang, O., Wang, X. et al. Leveraging language model for advanced multiproperty molecular optimization via prompt engineering. Nat Mach Intell (2024).
原创文章,作者:zhan1,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2024/10/31/c5f3373c11/