DNA 计算机甚至可以实现对电子计算机的控制。有研究将 DNA 计算机隐藏在生物样本中,通过预先编程,在检测样本的过程中入侵电子计算机的应用程序,获取其中信息,并使之按照DNA计算机的意图运行。
另一方面,随着 DNA 计算机的不断发展,人们发现 DNA 分子能够储存海量信息,且具有惊人的并行计算能力。这使人们意识到,DNA 计算机蕴藏巨大商业价值。2002 年,日本公司首次研制出能够投入到商业应用的 DNA 计算机。紧接着,美国加州斯克里普斯研究所和以色列理工学院的科学家联合开发出了一种 DNA 计算机,可用于破译存储在 DNA 芯片中的加密图像。
▲ DNA 计算机运行原理示意图。图/The Conversation Trust(UK)Limited
其次,大规模的 DNA 计算机需要在一支试管中使用大量(数万亿个)DNA 分子执行计算任务,这使得 DNA 计算机的设计难度随着规模的扩大迅速上升,副反应也会增加。因此,平衡计算机的规模、计算速度和执行计算的 DNA 分子数目至关重要,构建具有更强大计算能力的人工分子反应网络仍存在极大挑战。
迈出复杂识别第一步
目前人工智能中常用的卷积神经网络,是一类强大的机器学习模型,网络具有稀疏连接和权重共享的特征。与大多数机器学习模型相比,卷积神经网络能够以更低的复杂度实现更复杂的计算任务。科学家自然不会放过在这种模型上尝试 DNA 分子计算。
华东师范大学化学与分子工程学院裴昊教授团队一直致力于 DNA 计算机的设计和开发。基于在核酸化学方面的研究基础,面向分析化学、计算机科学与分子生物学的交叉融合发展,课题组针对发展超大规模 DNA 分子反应网络这一关键科学难题,与长期从事人工智能与分子科学研究的朱通课题组合作,建立了一种 DNA 卷积神经网络的系统实现策略。简言之,就是使用模仿人脑功能的卷积神经网络,让 DNA 计算机“学习”大量训练数据,“记忆”32 个类别的分子字迹。
最近,国际权威学术期刊《自然·机器智能》报道了裴昊团队设计的一种新的 DNA 计算模块——“开关门”,用以在分子水平上实现卷积神经网络,进而完成对 32 类图谱的识别和分类。
在计算任务中,手写字符首先被转化为 12×12 的正方形网格上的 25 个像素格点,被称为“分子笔迹”。这意味着,每个“分子笔迹”都由 144 个 DNA 分子库中的任意 25 个 DNA 分子组成。接下来,研究人员构建了两个简单的 DNA 计算机,成功实现了两类“分子笔迹”在 360° 平面上不同旋转角度下的识别,以及以“火”“土”“木”“水”“天”“气”“人”和“生”这八个甲骨文字作为目标“记忆”模式的分类任务。
在这项工作中,裴昊研究组进一步构建了具有两层电路结构的 DNA 计算机,通过粗分类(语言粗略分类)和细分类(特定的手写符号)两个步骤,实现了 32 个类别的模式识别。这是现有的能够识别最多种类图谱的 DNA 计算机。
值得一提的是,完成这项任务的整个 DNA 卷积神经网络只需 512 类不同的 DNA 分子,这一数量远远低于已经被报道的 DNA 神经网络正确运行所需的 DNA 分子数,揭示了利用卷积神经网络能够在大规模 DNA 计算机中有效减少使用的 DNA 分子数目,这对未来的 DNA 计算机设计具有重要意义。
在这篇论文中,研究人员还提出了一种简单的循环冻融策略——将 DNA 计算机在液氮中迅速冷冻之后再在 37℃ 下解冻,并多次循环这一操作。循环冻融策略成功地将 DNA 计算机的计算时间从几小时缩短到几分钟。
这一 DNA 计算机具有超高的计算能力,且能够实现对复杂信息的准确分类,并可能赋予 DNA 计算机类似于生物神经网络的“智能”行为。原则上,基于 DNA 的计算设备可通过连接感官输入,使用数百个目标作为输入,促进在疾病诊断、表达模式分析和精准医学中的更广泛应用。
尽管科学家们才刚刚开始探索在分子体系中创造人工智能的方法,但 DNA 计算机的潜力不可低估。或许在不远的将来,与人体合二为一的 DNA 计算机会成为人体的一部分,甚至是外部延伸,完成电子计算机难以实现的医疗诊断和治疗任务。