钙钛矿发光二极管(PeLEDs)因其高色纯度、高效率和高亮度而引起了广泛关注,在显示和照明方面显示出巨大的潜在应用。有机分子的增材工程,即在钙钛矿前体溶液中添加有机功能分子,对于实现高性能钙钛矿光电器件至关重要。添加剂的结构和相关的物理化学性质会影响器件性能,因为其对钙钛矿晶体、形态、点缺陷和前体化学的影响很复杂。因此,通过实验寻找合适的添加剂既昂贵又耗时,而传统的机器学习(ML)由于在这个相对较新的领域中可用的实验数据有限,因此难以准确预测。
为此,南京工业大学黄维院士、王建浦教授、朱琳等人展示了一种深度学习(DL)方法,该方法可通过使用132个分子的小型数据集以高达96%的高精度预测钙钛矿发光二极管(PeLED)中添加剂的有效性。研究表明,该DL模型可最大限度地利用分子的信息,并显著缓解以前传统的ML模型进行分子筛选时经常出现的重复问题。通过使用预测的添加剂,最终可实现非常高效率的PeLED,其峰值外量子效率(EQE)高达22.7%。总之,这项工作为进一步提高钙钛矿光电器件的性能开辟了一条新途径。该研究以“Deep Learning for Additive Screening in Perovskite Light-Emitting Diodes”为题发表于国际化学顶级期刊《Angewandte Chemie International Edition》。
要点1:数据集准备
由于可用的实验数据相对丰富,作者选择了基于三碘化甲脒(FAPbI3)钙钛矿的 LED作为案例研究,器件结构为ITO/PEIE-改性ZnO/FAPbI3/TFB/MoOx/Au。该结构已得到广泛应用,可通过有效且平衡地注入电荷载流子来产生高效的电致发光。作者建立了一个包含132个经过实验测试的添加剂分子的数据集用于训练ML模型,其中EQE的中值为10.3%。数据分为两类:0~10.29%被视为“不良添加剂”,10.3%~22.0%被视为“良好添加剂”,二者分别标记为0和1。数据集被随机分成训练集和验证集,比例为90:10。此外,使用12个额外的分子作为测试集来验证模型的性能。
先前的研究表明,基于传统的ML模型识别PeLED中添加剂分子的准确率很低:支持向量机10倍交叉验证准确率为78.57%,逻辑回归为83.57%,朴素贝叶斯为80.71%,XGBoost为75.71%,LightGBM为69.29%,CatBoost为80.71%。作者意识到,已建立的单个分子指纹仅描述了分子的部分信息。MACCS指纹基于结构片段的存在与否,反映了化学元素和子结构。FP2指纹基于最多七个原子的线性片段索引小分子片段,并提供相对全面的线性化学环境。ECFP利用摩根算法对分子进行编码,是一个圆形拓扑指纹。
为获得更多分子的化学结构信息,作者构建了一种基于神经网络的算法来组合多个指纹。基于此,作者利用多个指纹作为输入来训练增强分子信息模型(EMIM)。结果显示,MACCS和ECFP的组合获得了85.71%的验证准确率,远高于单独的 MACCS或ECFP。在FP2和ECFP样本中也可获得类似结果。令人鼓舞的是,具有多个指纹的EMIM的平均10倍交叉验证准确率可达88.93%,显著高于单个指纹。上述结果表明,EMIM模型可有效提取更全面的分子特征,从而具有较高的验证精度。
为进一步提高模型筛选能力,需要将更多有用的分子信息整合到模型中。作者通过RDKit从SMILES生成208个添加剂描述符,并将其与多个指纹同时输入EMIM模型。结果显示,具有分子指纹和分子描述符的EMIM在训练中比多个指纹更有效,其最高准确率为96.43%,10倍交叉验证实验的平均准确率达 92.86%。上述结果表明,在能够全面准确地提取分子信息的情况下,基于EMIM强大的信息管理功能可显著提高准确性。
进一步,作者通过使用12个额外的添加剂分子作为测试集进一步验证了EMIM的可靠性。具有多个指纹的EMIM预测其中6个是“不良添加剂”,而结合描述符的模型预测5个是“不良添加剂”。然后,作者基于12种添加剂制造了器件并测量其性能。结果显示,2个样本预测与多指纹EMIM的实验结果不一致,表明准确率为83%。带有指纹和描述符的EMIM仅预测1个错误样本,表明准确率为92%。因此,这种准确性与训练结果非常匹配。
此外,EMIM还可有效为PeLED找到良好的添加剂。图4显示了使用一种高效添加剂Tween制造的器件的光电特性,该器件的峰值EQE可达22.7%,是效率最高的PeLED之一。作者认为,使用Tween添加剂实现的高器件EQE是通过结晶过程、缺陷钝化和形貌控制综合增强的结果,仅通过实验方法不易获得。
综上所述,研究人员提出了一种高计算效率的新模型(EMIM)以实现基于小数据集的分子识别,该模型首次实现了高性能PeLEDs添加剂的有效性预测。通过使用预测的新添加剂,实现了具有高达22.7% 峰值EQE的高效PeLED。作者认为,EMIM具有强大的功能,可通过小型实验数据集实现分子的准确预测,这对于相对较新和快速发展的领域而言很有前景。
Deep Learning for Additive Screening in Perovskite Light-Emitting Diodes, Angewandte Chemie International Edition 2022. DOI: 10.1002/anie.202209337
https://onlinelibrary.wiley.com/doi/10.1002/anie.202209337
原创文章,作者:v-suan,如若转载,请注明来源华算科技,注明出处:https://www.v-suan.com/index.php/2023/10/08/1b71c801d6/