论文部分内容阅读
近期的《自然》杂志中发表一项研究,来自加州理工学院生物工程助理教授Lu-lu Qian(钱璐璐)实验室发明了一种由DNA制成的人工神经网络,可以正确识别分子数字。这项工作标志着人工智能在编入合成生物分子电路方面,迈出了重要的一步。
“尽管科学家只是刚刚开始探索在分子机器中创造人工智能,但却具有无可争辩的巨大潜力。”钱璐璐表示。相比百年前,电子计算机和智能电话已经让人类变得更有能力。与之相似的是,人工分子机器可以使所有物体分子化。在未来的百余年中,人工分子机器将更有能力和快速地对周围的环境作出反应。
人工神经网络是由人类大脑启发所得的数学模型。虽然相比生物神经网络,人工的还是太过简单,可是它已经具备了如神经元网络一样的功能,可以处理复杂的信息。钱教授实验室对于这项研究的终极目标是为DNA人工神经网络中的一系列智能行为编程(能够计算、做决定甚至更多)。
钱教授认为:“每个人类的大脑中有800亿个神经元,它们负责处理高度负责的决定,而蛔虫只能用几百万的神经元处理较为简单的决定。在这次的研究中,我们设计并创造了一种生物化学回路,它可以像小神经元网络一样,分类较从前更复杂的分子信息。”
为说明DNA神经网络的能力,钱教授实验室的研究生Kevin Cherry为人工神经网络选择了一项经典挑战任务:识别手写。人类手写千变万化,当一个人仔细识别一串数字涂鸦,大脑就会进行复杂的计算以识别出文字,即使对于人类而言识别出他人潦草的书写也是件非常困难的事情。
识别手写字母是将智能编程为人工神经网络的一项常用方法,这些网络必须“教授”如何识别数字,考虑手写时的变化,然后将未知的数字与它们所说的“记忆”相比较,最后决定数字的身份。简单来讲,所谓的DNA神经网络就是将DNA和试管作为构建神经网络的物理基础,就相当于我们通常所见的硅和晶体管。
2011年,钱教授和同事创造了首个DNA人造神经模式,但它只能识别出少量的四个模式。《自然》杂志论文的第一作者Cherry 论证了,经过严格设计的DNA序列可以实现规定的化学反应,进而正确识别分子手写。不同于几何形状多变的视觉手写,每个分子手写的例子并不能真正地呈现数字的形状。相反,每个分子数字是由选自100个分子中的独特DNA链组成,每个被分配的分子代表任意一个10×?10图案中的一个独立像素,在一个试管中这些DNA链互相融合。
给定一个分子手写的特定样本,DNA神经网络可以将手写分为9类,每一类都代表了手写1到9数字的1/9种可能。首先Cherry建立了一个DNA神经网络用以区别手写数字6和7,他测试了36个手写数字,结果试管神经网络准确地识别了所有数字。从理论上来讲,这个系统能够分类超过12000个手写数字6和7,其中90%的数字抽取自手写数字数据库。
而钱璐璐之前制造的DNA机器人,则在模拟计算机的运算过程中也派上了用场。其中的主角“入侵链”,是一个具有特定核苷酸序列的单链DNA分子;它会与另一双链DNA结合,迫使其断裂原有的氢键,释放出双螺旋的另一条链,该链叫做释放链。其中,入侵链可以看作一个输入信号,而释放链则是输出信号;输入链在释放后,可以转化为入侵链,与不同的分子反应,最终分子之间形成了一个相互作用的网络,可以模拟复杂的“输入-输出”的运算功能。
这一运算过程的关键,是利用DNA分子编码“赢者通吃”的竞争策略。在确定未知数字时,使用被称为“歼灭者”的特定DNA分子来选择优胜者,歼灭者与不同分子的竞争者形成复合体,经过反应生成不发生化学反应的物质。歼灭者迅速吃掉所有竞争者分子,直到剩下最后一个竞争者。最后,获胜的竞争者恢复到一个相当高的浓度,并产生指示网络决策的荧光信号。
“赢家通吃”的神经网络,被认为能够对数据库中98%的手写数字进行正确分类识别。而在此之前,钱璐璐就做过类似的尝试。只是在过去的实验中,仅通过4种不同的DNA分子组成的识别模型,在图像的数量与复杂性上都大大受限;相比之下,新模型具有更强大的计算力,即可以大规模“扫荡”简单图形,又可以小范围识别复杂图像。
如果在20世纪,我们因为一个手掌大小的灰色金属仪器而震惊,那么在21世纪,我们是不是会看到一碗含有智能分子的“智慧汤”:通过在汤中加入特定的原材料,我们可以训练其执行不同的任务;在一个接一个的化学反应中,“智慧汤”不断学习进化,得出结论,并以分子化合物的形式储存,形成“记忆”。这就像你对着汤抛出一个问题,它会不断的思考,最终给你答案一样。
而接下来Cherry依靠他首个DNA神经网络的原则,发展出另一个更加复杂可以在1到9之间区分单独3位数的模式,当给定一个未知数字,这个“智能汤”将接受一系列的反应并输出两个荧光信号,比如绿或黄代表5绿或红代表9。
钱教授和Cherry计划发展一种可以学习,从添加在试管中的数据例子中形成记忆的模式。钱教授表示,同样的“智慧汤”可以被训练成执行各种不同的任务。通常的医学诊断可以探测出一些生物分子的存在,比如胆固醇、血糖。使用这种更加复杂的生物分子电路,可以让医学诊断和试验的范围更加广泛,从而囊括上百种生物分子,并且在分子环境中直接对其进行分析。
不过,这些距离现实应用还有很远的距离,但科学家们期望的,不仅是将這种智能分子机器作为一个计算机的替代品,即便它或许能做出更复杂的计算与决策,我们更想看到的是,其生物属性里蕴涵着巨大的潜能。
编译自《自然》《Caltech》
(责任编辑 姜懿翀)
“尽管科学家只是刚刚开始探索在分子机器中创造人工智能,但却具有无可争辩的巨大潜力。”钱璐璐表示。相比百年前,电子计算机和智能电话已经让人类变得更有能力。与之相似的是,人工分子机器可以使所有物体分子化。在未来的百余年中,人工分子机器将更有能力和快速地对周围的环境作出反应。
人工神经网络是由人类大脑启发所得的数学模型。虽然相比生物神经网络,人工的还是太过简单,可是它已经具备了如神经元网络一样的功能,可以处理复杂的信息。钱教授实验室对于这项研究的终极目标是为DNA人工神经网络中的一系列智能行为编程(能够计算、做决定甚至更多)。
钱教授认为:“每个人类的大脑中有800亿个神经元,它们负责处理高度负责的决定,而蛔虫只能用几百万的神经元处理较为简单的决定。在这次的研究中,我们设计并创造了一种生物化学回路,它可以像小神经元网络一样,分类较从前更复杂的分子信息。”
为说明DNA神经网络的能力,钱教授实验室的研究生Kevin Cherry为人工神经网络选择了一项经典挑战任务:识别手写。人类手写千变万化,当一个人仔细识别一串数字涂鸦,大脑就会进行复杂的计算以识别出文字,即使对于人类而言识别出他人潦草的书写也是件非常困难的事情。
识别手写字母是将智能编程为人工神经网络的一项常用方法,这些网络必须“教授”如何识别数字,考虑手写时的变化,然后将未知的数字与它们所说的“记忆”相比较,最后决定数字的身份。简单来讲,所谓的DNA神经网络就是将DNA和试管作为构建神经网络的物理基础,就相当于我们通常所见的硅和晶体管。
2011年,钱教授和同事创造了首个DNA人造神经模式,但它只能识别出少量的四个模式。《自然》杂志论文的第一作者Cherry 论证了,经过严格设计的DNA序列可以实现规定的化学反应,进而正确识别分子手写。不同于几何形状多变的视觉手写,每个分子手写的例子并不能真正地呈现数字的形状。相反,每个分子数字是由选自100个分子中的独特DNA链组成,每个被分配的分子代表任意一个10×?10图案中的一个独立像素,在一个试管中这些DNA链互相融合。
给定一个分子手写的特定样本,DNA神经网络可以将手写分为9类,每一类都代表了手写1到9数字的1/9种可能。首先Cherry建立了一个DNA神经网络用以区别手写数字6和7,他测试了36个手写数字,结果试管神经网络准确地识别了所有数字。从理论上来讲,这个系统能够分类超过12000个手写数字6和7,其中90%的数字抽取自手写数字数据库。
而钱璐璐之前制造的DNA机器人,则在模拟计算机的运算过程中也派上了用场。其中的主角“入侵链”,是一个具有特定核苷酸序列的单链DNA分子;它会与另一双链DNA结合,迫使其断裂原有的氢键,释放出双螺旋的另一条链,该链叫做释放链。其中,入侵链可以看作一个输入信号,而释放链则是输出信号;输入链在释放后,可以转化为入侵链,与不同的分子反应,最终分子之间形成了一个相互作用的网络,可以模拟复杂的“输入-输出”的运算功能。
这一运算过程的关键,是利用DNA分子编码“赢者通吃”的竞争策略。在确定未知数字时,使用被称为“歼灭者”的特定DNA分子来选择优胜者,歼灭者与不同分子的竞争者形成复合体,经过反应生成不发生化学反应的物质。歼灭者迅速吃掉所有竞争者分子,直到剩下最后一个竞争者。最后,获胜的竞争者恢复到一个相当高的浓度,并产生指示网络决策的荧光信号。
“赢家通吃”的神经网络,被认为能够对数据库中98%的手写数字进行正确分类识别。而在此之前,钱璐璐就做过类似的尝试。只是在过去的实验中,仅通过4种不同的DNA分子组成的识别模型,在图像的数量与复杂性上都大大受限;相比之下,新模型具有更强大的计算力,即可以大规模“扫荡”简单图形,又可以小范围识别复杂图像。
如果在20世纪,我们因为一个手掌大小的灰色金属仪器而震惊,那么在21世纪,我们是不是会看到一碗含有智能分子的“智慧汤”:通过在汤中加入特定的原材料,我们可以训练其执行不同的任务;在一个接一个的化学反应中,“智慧汤”不断学习进化,得出结论,并以分子化合物的形式储存,形成“记忆”。这就像你对着汤抛出一个问题,它会不断的思考,最终给你答案一样。
而接下来Cherry依靠他首个DNA神经网络的原则,发展出另一个更加复杂可以在1到9之间区分单独3位数的模式,当给定一个未知数字,这个“智能汤”将接受一系列的反应并输出两个荧光信号,比如绿或黄代表5绿或红代表9。
钱教授和Cherry计划发展一种可以学习,从添加在试管中的数据例子中形成记忆的模式。钱教授表示,同样的“智慧汤”可以被训练成执行各种不同的任务。通常的医学诊断可以探测出一些生物分子的存在,比如胆固醇、血糖。使用这种更加复杂的生物分子电路,可以让医学诊断和试验的范围更加广泛,从而囊括上百种生物分子,并且在分子环境中直接对其进行分析。
不过,这些距离现实应用还有很远的距离,但科学家们期望的,不仅是将這种智能分子机器作为一个计算机的替代品,即便它或许能做出更复杂的计算与决策,我们更想看到的是,其生物属性里蕴涵着巨大的潜能。
编译自《自然》《Caltech》
(责任编辑 姜懿翀)