该论文还针对基于定制化文本的分子生成任务做了进一步的探索。如图10所示,例1中的输入强调了结构中的五个苯环和疏水基团。然而MolT5的结果产生了不正确的苯环数量,并且生成的结构含有一些亲水基团。相比之下,MolReGPT则给出了与输入相对应的正确结构。在例2中,MolT5和MolReGPT都生成了正确的苯环数量,而MolReGPT生成了更多的亲水基团,更符合我们给定的输入。05 结论这篇文章提出了MolReGPT,一种通用的基于检索的上下文小样本分子学习的提示范式,赋予大语言模型(如ChatGPT)分子发现的能力。MolReGPT利用分子相似性原理从本地数据库中检索分子-分子文本描述对作为上下文学习中的示例,指导大语言模型生成分子的SMILES字符串,从而无需对大语言模型进行微调。这篇工作的方法专注于分子-文本描述间相互翻译任务,包括分子文本描述生成(Mol2Cap)和基于文本的分子生成(Cap2Mol),并在该任务上对大语言模型的能力进行了评估。实验结果表明,MolReGPT可以使ChatGPT在分子描述生成和分子生成方面分别达到0.560和0.571的Text2Mol分数。从分子理解和基于文本的分子生成角度来看,其性能都超过了MolT5-base这样的微调模型,甚至可以与微调的MolT5-large相媲美。总而言之,MolReGPT提供了一个新颖的、多功能集成的范式,通过上下文学习在分子发现中部署大型语言模型,这大大降低了领域转移的成本,探索了大型语言模型在分子发现中的潜力。参考文献[1] Edwards, C., Zhai, C., and Ji, H. Text2mol: Cross-modal molecule retrieval with natural language queries. In Pro- ceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pp. 595–607, 2021.[2] Edwards, C., Lai, T., Ros, K., Honke, G., Cho, K., and Ji, H. Translation between molecules and natural language. In Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing, pp. 375–413, Abu Dhabi, United Arab Emirates, December 2022. As- sociation for Computational Linguistics.[3] Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, Ł., and Polosukhin, I. At- tention is all you need. Advances in neural information processing systems, 30, 2017.[4] Raffel, C., Shazeer, N., Roberts, A., Lee, K., Narang, S., Matena, M., Zhou, Y., Li, W., and Liu, P. J. Exploring the limits of transfer learning with a unified text-to-text transformer. The Journal of Machine Learning Research, 21(1):5485–5551, 2020.[5] Li, J., Liu, Y., Fan, W., Wei, X. Y., Liu, H., Tang, J., & Li, Q. (2023). Empowering Molecule Discovery for Molecule-Caption Translation with Large Language Models: A ChatGPT Perspective. arXiv preprint arXiv:2306.06615.博士招生广告香港理工大学PolyU电子计算学系 机器学习/人工智能 (生物医药方向,AI4Science, Drug Discovery) 全奖PhD/博士后/研究助理让我们一起探索人工智能和生物医药的交叉领域,为未来的医药发展作出贡献!导师主页:李青教授个人主页:https://www4.comp.polyu.edu.hk/~csqli/导师主页:范文琦博士(研究助理教授)个人主页:https://wenqifan03.github.io计划招收多名全奖博士生,全年春/夏/秋入学均可(全年招聘)招生详情请见:https://wenqifan03.github.io/openings.html此外,研究团队长期招聘博士后和研究助理,及联合培养博士项目,欢迎联系。邮件建议:感兴趣的同学按照下面的邮件格式把简历发到邮箱:wenqi.fan@polyu.edu.hk (范文琦博士),并同时抄送qing-prof.li@polyu.edu.hk (李青教授)邮件主题:PhD/Postdoc/RA-Open Position-YourName正文:个人经历简介,包括毕业院校、GPA/Ranking、TOEFL/IELTS英文成绩、publications/research experience、奖项、etc.