DNA 包裹的单壁碳纳米管 (SWNT) 偶联物具有独特的光学特性,可用于生物传感和成像应用。DNA-SWNT传感器开发的一个关键限制是目前无法预测赋予这些传感器强烈的分析物特异性光学响应的独特DNA序列。在此,美国德克萨斯大学埃尔帕索分校Lela Vuković及加州大学伯克利分校Markita P. Landry等人基于~100个DNA-SWNT偶联物的近红外(nIR)荧光响应数据集,通过从~ 1010个独特的DNA-SWNT候选池开始的选择性进化协议缩小范围并将其用于训练机器学习(ML)模型,以预测对神经递质血清素具有强烈光学反应的DNA序列。首先,在序列特征上进行训练基于卷积神经网络(CNN)的分类器模型,以将DNA配体分类为对血清素的高/低反应性。其次,训练支持向量机(SVM)回归模型来预测DNA序列的相对光学响应值。最后,通过验证实验证明,将最高质量的神经网络分类器(卷积/人工)和SVM回归模型的集成预测相结合,可以实现对高/低响应序列的最佳预测(高响应序列的预测正确率为60%,对低响应序列的预测正确率为90%)。图1. 在初始数据集上训练的代表性CNN模型的性能总体而言,作者基于ML方法发现了五个血清素 DNA-SWNT传感器。重要的是,这些传感器都比以前仅使用手动筛选并通过实验确定的传感器具有更高的响应值。此外,使用该模型预测对血清素(或任何感兴趣的分析物,如干扰剂)无反应的DNA序列的能力对于传感器设计也很重要。综上所述,这项研究结果表明ML方法可以快速识别对目标分析物有高反应性的DNA序列,并且可以显著加快基于DNA-SWNT偶联物的技术的发展,包括生物传感器、生物电子学和SWNT的手性分离。图2. 基于多个高质量分类和回归模型预测DNA序列对血清素的反应Discovery of DNA–Carbon Nanotube Sensors for Serotonin with Machine Learning and Near-infrared Fluorescence Spectroscopy, ACS Nano 2021. DOI: 10.1021/acsnano.1c08271