科学家正准备把你的DNA做成芯片

发布时间:

来源: 电子工程世界

100多年前，英国数学家艾伦·图灵（Alan Turing）的图灵机为现代计算奠定了基础，而到现在，人类也一直在基本同样原理下研究芯片。

一百年后的今天，摩尔定律开始放缓，人们的目光放到了同样处在微观世界的DNA身上，并悄悄地把它放在电子技术的新赛道上。

付斌｜作者

电子工程世界（ID：EEworldbbs）｜出品

初创公司推出DNA存储卡

最近，一家名为Biomemory的法国初创公司推出全球首款DNA存储卡（DNA Cards），可存储1KB数据。

别看它存储容量小，可这款DNA存储卡的数据可保存至少150年，远超任何人的寿命。不过，这样“过于超前”的产品，售价达到了惊人的1000欧元。

20世纪80年代，Biomemory科学家们首次在法国使用的嵌入微芯片的信用卡中汲取灵感，设计了一种类似银色信用卡的设备，其中有一个圆形芯片，可以保存干燥的DNA。为保存DNA，卡被密封以防止任何氧气进入。

对于这个产品的下一步，Biomemory将扩大设备的容量，以容纳家庭照片、重要文档、音频和视频文件。并计划将存储时间延长到1000年，最终延长到10000年。由于DNA是在溶液中合成，因此下一步是将其干燥以延长其保质期。

当然，Biomemory显然明白对于普通人来说，花1000欧元存1KB数据对大多数人并不现实，因此该公司计划在2026年推出“Biomemory Prime”数据中心存储解决方案，可存储 100PB 数据。

不过，这也仅仅是最乐观的预期，毕竟这项技术还比较年轻，相比来说，排在它前面的还有玻璃或陶瓷存储技术。

用200公斤装下“整个世界”

DNA做成存储器，其实是一个“意外”。事实上，原本科学家事为生命科学应用而开发的DNA合成、测序和检索技术。相比传统的存储介质，DNA在信息保留时间、物理密度和体积编码容量方面都有着优势，但我们的技术还没有那么成熟。

互联网巨头微软也曾踏足这个领域，2017年，微软组建了特别技术小组，负责研发基于DNA编码技术的数据存储系统，彼时微软表示，在未来三年内，旨在研发出测试版“微缩型DNA生物存储器”。DNA容量最大且可塑性极强，能够解决爆炸式增长的数据信息与存储空间和技术不匹配的问题。

这些DNA生物存储器或许会成为每个人特制的“数据细胞器”，把全球所有电影、视频录像、照片和有价值的文档存储在每个人的DNA基因编码里，之所以能够实现这样的技术，基础在于基因编辑技术CRISPR-Cas9已趋于成熟了。

2019年，微软和华盛顿大学的研究人员又推进了DNA存储技术的发展。而后，微软还联合哈佛大学、华盛顿大学等曾一起成立了DNA数据存储联盟，推动DNA存储发展。

值得强调的是，DNA存储是国家“十四五”科技规划中明确提出要加快布局的前沿技术之一。而在美国《科学》杂志提出了未来125个科学问题中，DNA存储也是重点。

为什么大家如此关注DNA存储？这是因为数据正在以爆炸式速度增长，到2025年全球数据量会达到1750万亿字节，这些数据能耗巨大，传输体积也巨大，其中80%～90%极少被调用的“冷数据”。而且更为关键的是，信息存储在硅上，寿命大约是数十年。

DNA存储不仅密度高、能耗低，而且寿命长，能稳定保存百年、千年，极端条件下甚至可达百万年。举个例子来说，1000万块硬盘的数据，用50克的DNA就可以存储下来，而全世界440万亿字节的数据用200公斤DNA就可以存下来。

当然，这一切都是在理论中，这种技术多久才能面世，才能具备商业价值，都还是未知数。

国内轰动一时的研究

DNA是生物体内的遗传信息载体，其中腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G) 和胞嘧啶(C)4种含氮碱基按特定顺序排列以编码遗传信息。大自然，是否也遵循着什么编码规则？我们不得而知，但这样看，似乎与数学和程序有着很大的关系，科学家也从中找到了很大灵感。

1994年Adleman首先提出DNA计算模型的概念，他利用DNA碱基互补配对原则的热力学平衡过程构建了模型，以计算哈密尔顿路径问题，并取得了成功。

2004年，Okamoto等3位学者首次将数字电路与DNA计算相结合，构建DNA电路，并形成DNA逻辑门，即将不同级逻辑门通过级联的形式组成复杂的电路，最终实现通用的DNA计算，为DNA计算和组装技术实现新一代芯片组装提供了理论基础。

2009年，IBM利用DNA和纳米技术开发下一代微处理芯片，开创了DNA计算的新时代。此时，DNA计算已经具备一定战略性意义。

2023年底，海交通大学樊春海院士、王飞副教授团队一篇刊上Nature的论文也引发了巨大讨论，这标志着中国已经成功DNA计算领域取得重要进展。

DNA计算机依赖的不再是硅晶片，而是大自然数十亿年来用以编码生命蓝图的分子。这类计算机通过实验室操作来执行计算，并以DNA链式形式的数据作为输入和输出。

研究者通过集成支持通用性计算的多层DNA可编程门阵列（DPGA, DNA-based programmable gate array），展示了一种DNA集成电路（DIC）。他们发现，使用通用的单链寡核苷酸作为统一的传输信号，可以可靠地集成大规模DIC，并能最小化泄露，实现高保真度。此外对具有24个可寻址双轨门的单个DPGA进行重新配置，可以运行超过1000亿个不同的电路。

此外，为了控制分子本质上的随机碰撞，研究者设计了DNA折纸寄存器，为级联DPGA的异步执行提供了方向。他们通过三层级联DPGA（包含30个逻辑门、约500个DNA 链）组装而成的二次方程求解DIC证明了这一点。

研究者进一步证明，DPGA与模数转换器的集成可以对与疾病相关的microRNA进行分类。无明显信号衰减下集成大规模DPGA网络，这标志着迈向通用DNA计算的关键一步。

在试管里完成运算

与常规计算机相比，DNA计算潜力无限，它具有高并行、低能耗的优势。理论上，DNA每平方毫米最多可以存储1艾字节（exabyte）或10亿千兆字节。不仅如此，一滴水就能容纳数万亿DNA分子，这表明DNA计算能够并行执行海量计算的同时，只需要很少的能量。

科学家发现，DNA在一个试管里，一步就能完成1020次运算。一些电子计算机不能计算的问题，比如哈密尔顿路径问题，就可能通过DNA计算机来完成。DNA计算在未来的科学领域中，有望在优化计算、密码学、数学等领域取得突破性的创新和应用。

那么DNA是怎么计算的？它本质是利用大量不同核酸分子杂交，产生类似数学计算过程中某种组合的结果，并且根据限制条件得出约束解。

与传统的芯片蕾丝，DNA计算是由传统意义的“电路”构成的，不过这些电路是特定功能的DNA链构成的DNA电路，DNA电路中不使用任何类型的电压和电流，电路信号是DNA链的浓度或DNA链中特定片段的有无。

相比传统计算机，DNA计算机并行计算能力强，也就是说DNA可以像GPU一样，同时计算大量内容，同时DNA计算具有非常高的能量效率和存储容量。

值得一提的是，DNA不仅能实现数字电路，还能实现模拟电路。

数字电路方面，AND、OR、XOR、NOT、NAND、NOR和XNOR这些逻辑门是关键，DNA计算则以DNA链浓度作为信号，浓度高于特定阈值，则认为该信号为逻辑高，否则为逻辑低，有点类似高电平、低电平。

根据这种原理，Nielsen曾经参考FPGA的编码方式进行设计了一个自动化设计基因电路的平台Cello，设计编码方式与Verilog相似。科学家们也把这种器件叫做DPGA（高度可扩展的基于DNA的可编程门阵列，DNA-based programmable gate arrays，DPGAs)。

模拟电路方面，输入和输出信号通常用分子浓度来表示，即模拟DNA元件能够感知特定分子在具体环境中的浓度，然后通过适当的模拟计算产生固定浓度的输出信号。模拟电路中最基础的元件是晶体管，但是DNA电路无法转变为DNA晶体管电路，因此在DNA模拟电路中在行为层面上将模拟电子电路映射到模拟DNA电路。目前，科学家已经利用DNA实现了反馈控制电路、决策器、神经生物学的模数转换和数模转换等。

需要强调的是，尽管DNA计算被证实是通用计算，但DNA计算在实际应用中无法取代电子计算，最优方案是利用DNA计算实现高度并行任务，而固有的串行任务仍采用电子计算完成。同时，DNA计算发展有三方面障碍：

对大规模系统进行物理处理时会产生错误；
在PCR扩增环节存在基因突变的问题；
目前在浓度检测过程中缺少快捷高效的检测仪器。

随着生物技术不断进步，DNA越来越被人“玩出花”，随着电子技术逐渐产生瓶颈，学科交叉成了越来越领域突破瓶颈的关键。

文章来源于: 电子工程世界原文链接

本站所有转载文章系出于传递更多信息之目的，且明确注明来源，不希望被转载的媒体或个人可与我们联系，我们将立即进行删除处理。