​姜建文教授ACS AMI: 机器学习辅助加速发现高自由体积分数聚合物

​姜建文教授ACS AMI: 机器学习辅助加速发现高自由体积分数聚合物
作为聚合物的基本结构特征,自由体积分数(FFV)在控制聚合物性能方面起着不可或缺的作用。然而,新的高FFV聚合物的设计具有挑战性。
​姜建文教授ACS AMI: 机器学习辅助加速发现高自由体积分数聚合物
在此,新加坡国立大学姜建文教授等人报道了一种数据驱动的方法,旨在加速高 FFV聚合物的发现。首先,作者提出了一种FFV的计算方法,并开发了两步分段方法以构建用于聚合物结构数字表示的片段库。其中,Si-和环相关的片段是对FFV有正向影响的顶部片段,而长脂肪链、羰基和Cl-相关的片段对FFV有负面影响。然后,作者通过数据挖掘技术来识别高FFV聚合物中的有前景片段。
随后,基于数据集I中1683个聚合物的Vvdw和ρ值,作者通过结合3种机器学习(ML)算法(KRR、GPR和RFR)和6个指纹(255位片段、166位MACCS、512位RDKit、1024位RDKit、512位Morgan和1024位Morgan)来训练ML模型,最后在包含11479种聚合物的另一个数据集II中进行了样本外预测。
​姜建文教授ACS AMI: 机器学习辅助加速发现高自由体积分数聚合物
图1. 数据驱动方法发现高FFV聚合物的工作流程
ML结果显示,结合本文开发的255位片段指纹的RFR算法显示出最佳预测精度。模型性能在训练集和测试集之间的不同随机分割上表现稳定,且在Vvdw和ρ 的ML模型中也观察到类似的重要特征。根据数据集II中11479种聚合物的样本外预测,证明了模型的可迁移性。ML模型用于预测数据集III中约100万个假设聚合物的FFV,预测出29482种聚合物的FFV > 0.2。
此外,作者通过分子模拟验证了12种具有代表性的高FFV聚合物并强调了设计策略。为了进一步促进新的高FFV聚合物的发现,作者开发了一个在线交互平台https://ffv-prediction.herokuapp.com,允许在给定聚合物结构的情况下快速预测FFV。总之,这项研究中的数据驱动方法可能会推动新的高FFV聚合物的开发,并进一步探索聚合物的定量结构-性能关系。
​姜建文教授ACS AMI: 机器学习辅助加速发现高自由体积分数聚合物
图2. ML模型筛选约100万个假设聚合物中的高FFV聚合物
Accelerating Discovery of High Fractional Free Volume Polymers from a Data-Driven Approach, ACS Applied Materials & Interfaces 2022. DOI: 10.1021/acsami.2c03917

原创文章,作者:v-suan,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2023/10/07/17a739db7b/

(0)

相关推荐