徐婷教授AM: 机器学习预测多组分纳米复合材料的自组装

第一作者：Emma Vargo

通讯作者：徐婷教授

通讯单位：加州大学伯克利分校

研究背景

纳米颗粒、聚合物和小分子的混合物可自组装成具有结构依赖性特性的光学、磁性和电子器件。然而，多组分纳米复合材料的配方与其组装结构之间的关系十分复杂，无法通过理论来预测。目前，纳米复合材料器件的设计都是通过反复实验试错来完成的。机器学习（ML）方法是一种引人注目的替代方案，因为它可基于现有数据集来映射高维空间。该方法不依赖于已知参数之间的关系，因此适用于没有坚实理论基础的复杂系统。

文章简介

在此，美国加州大学伯克利分校徐婷教授等人应用一系列ML方法来研究三元纳米复合材料的自组装和相行为，该材料由二嵌段共聚物（聚苯乙烯-b-聚4-乙烯基吡啶，缩写为PS-b-P4VP）、氢键小分子（3-十五烷基苯酚，缩写为PDP）和带有烷基配体的氧化铁纳米颗粒（NP）组成。其中，作者基于595张纳米复合薄膜的原子力显微镜（AFM）图像组成的数据集训练ML模型：首先将每个图像转换为描述其周期性、微畴形态、缺陷密度和对齐的矢量；然后使用统计和ML技术探索输入和输出参数之间的相关性；最后基于ML模型来预测具有新成分的纳米复合材料的形态，该模型在9个案例中有7个是成功的。

这些预测为纳米复合材料系统提供了新的见解，表明ML技术有可能显著简化复杂系统的设计。这项研究以“Using Machine Learning to Predict and Understand Complex Self-Assembly Behaviors of a Multicomponent Nanocomposite”为题发表于材料顶级期刊Advanced Materials。

图文详情

要点1：相行为关系

作者探讨了包含三个构建块的复杂混合物的相行为，共混物由PS-b-P4VP嵌段共聚物（BCP）、氧化铁NP和PDP小分子组成并通过溶剂蒸气退火处理。当添加的PDP超过4VP键合位点时，未键合的PDP分子与混合物中的所有其他成分适度混溶。该系统重新分配PDP的能力导致整个纳米复合材料系统的配方灵活性，并允许有序地结合具有各种尺寸、形状和核心化学成分的NPs。这种三元混合物的可能成分和加工条件占据了极大的参数空间，沿任何一对变量的2D切片揭示了复杂、交织的相互作用。

图1. 三元纳米复合体系的组成、图像及参数空间

要点2：图像分析

作者使用的自动图像分析流程如下：首先，作者通过径向积分每个AFM图像的快速傅里叶变换发现微畴周期性和平均晶粒尺寸。接下来，将灰度显微图像简化为二值图像，连接的微畴被分组在一起且计算暗畴与亮畴的总体比率。作者将暗畴的面积分数称为“微畴比”（r_D），晶粒尺度分析使用滑动窗口技术对AFM图像中的区域进行分类。在整个图像上光栅化一个周期的方形窗口，并在每个子图像中识别微畴形态。然后，使用标记的子图像矩阵来确定图像中存在的形态。最后，微畴尺度分析需要处理每个单独的微畴特征，通过将微畴减少到单像素骨架并测量其连通性来识别末端和连接缺陷。

图2. 图像分析流程及数据集缺陷

包含近600张AFM图像的数据集是了解纳米复合材料系统的重要资源，但它仍存在以下不足：首先，AFM仅探测3D结构的顶面，因此仍需要横截面显微镜或X射线散射来确认微畴形态。尽管可推断出3D结构，但此处选择了使用2D描述符标记图像：“线条”、“点”和“无特征”。此外，AFM图像的收集时间为6年，环境、材料和加工过程中未记录的变化都会产生无法解释的差异。

要点3：统计分析

相关矩阵用于比较所有输入和输出变量之间的成对相关强度并使用皮尔逊相关系数r进行量化。作者将r_D确定为对预测和理解最感兴趣的特征，这似乎是输入和输出特征之间的重要联系。由于NP和PDP分子在化学上与P4VP更相容，最初预计在薄膜表面测量的r_D将高于全样本平均值。然而，汇总数据显示出相反的趋势，即真实值通常低于预测值。

图3. 从图像分析结果中提取的统计关系

根据r_D预测趋势，预计30~40%的游离PDP被结合到典型样本中的PS微畴中。然而，该分数因每种纳米复合材料成分而异，因为PDP位移取决于NP尺寸和负载。因此，纳米复合材料不能可靠地设计为特定的微畴形态。此外，对于任何给定的r_D，样本都可表现出多种形态。为了解决这些瓶颈，作者转向ML来研究输入参数与生成的纳米结构之间的关系。

要点4：机器学习

为了识别高维参数空间中的有用关系，作者使用ML技术来拟合每个输出值。尽管输入和输出具有连续性，但基于随机森林回归器（RFR）的模型在参数空间内绘制了清晰的边界，似乎产生了最好的预测。作者观察到预测精度从根本上受实验精度的限制，并且不同输出量的模型性能差异主要是由实验再现性差异驱动的。为了理解实验不确定性对预测能力的影响，作者考虑引入了一个额外的χ²度量。

图4. 随机森林回归器的预测质量

此外，作者计算了每个预测输出的基于杂质的特征重要性：BCP分子量对于预测周期性很重要，而r_D和形态分数更依赖于计算的成分变量。由于测得的r_D与每个形态分数都有很强的相关性，作者还尝试用较少的输入变量预测样本形态。r_D在很大程度上决定了纳米复合材料的结构，但关键区别在于r_D值不能直接从纳米复合材料的组成中计算，因此必须通过其他方式进行估计。

图5. 用于预测纳米结构的ML模型评估

一旦能够将多个输入参数展平为单个r_D预测值，就可将ML响应函数绘制为预测相图。作者选择并测试了9种纳米复合材料组合物，虽然不能用于定量预测且相图也不完美，但最终在7种材料中准确预测了多数相或相共存。这表明该ML模型除了以定性方式应用于其特定训练集之外，还可用于将实验工作集中在更广泛参数空间的有希望领域。

总结与展望

总之，这项研究代表了首个替代设计超分子纳米复合器件的试错性试验的方案。作者证明了微畴比（r_D）是预测形态的关键参数，但不能基于每个微畴中组分的重量比来计算。RFR模型能够基于实验输入预测纳米复合材料的微畴形貌，甚至可预测新的嵌段共聚物的样本外形貌。使用预测的r_D作为输入，最终成功预测出9个案例中出现的7个微畴特征类型。然而，微畴特征比率的定量预测仍然遥不可及，这可归因于多组分混合物的固有复杂性。除了实验误差之外，这种复杂性来自超分子纳米复合材料的小分子再分布和动力学依赖性。这些结果促使未来努力通过实验量化每个组件的空间分布及动力学路径，并在所有相关长度尺度上表征组装。总之，这项研究表明ML将成为未来纳米复合材料设计的重要工具。

文献信息

Using Machine Learning to Predict and Understand Complex Self-Assembly Behaviors of a Multicomponent Nanocomposite, Advanced Materials 2022. DOI: 10.1002/adma.202203168

https://onlinelibrary.wiley.com/doi/10.1002/adma.202203168

原创文章，作者：v-suan，如若转载，请注明来源华算科技，注明出处：https://www.v-suan.com/index.php/2023/10/07/b084aed93b/

徐婷教授AM: 机器学习预测多组分纳米复合材料的自组装

相关推荐

分享到：