100多年前,英国数学家艾伦·图灵(Alan Turing)的图灵机为现代计算奠定了基础,而到现在,人类也一直在基本同样原理下研究芯片。
一百年后的今天,摩尔定律开始放缓,人们的目光放到了同样处在微观世界的DNA身上,并悄悄地把它放在电子技术的新赛道上。
付斌|作者
电子工程世界(ID:EEworldbbs)|出品
初创公司推出DNA存储卡
最近,一家名为Biomemory的法国初创公司推出全球首款DNA存储卡(DNA Cards),可存储1KB数据。
别看它存储容量小,可这款DNA存储卡的数据可保存至少150年,远超任何人的寿命。不过,这样“过于超前”的产品,售价达到了惊人的1000欧元。
20世纪80年代,Biomemory科学家们首次在法国使用的嵌入微芯片的信用卡中汲取灵感,设计了一种类似银色信用卡的设备,其中有一个圆形芯片,可以保存干燥的DNA。为保存DNA,卡被密封以防止任何氧气进入。
对于这个产品的下一步,Biomemory将扩大设备的容量,以容纳家庭照片、重要文档、音频和视频文件。并计划将存储时间延长到1000年,最终延长到10000年。由于DNA是在溶液中合成,因此下一步是将其干燥以延长其保质期。
当然,Biomemory显然明白对于普通人来说,花1000欧元存1KB数据对大多数人并不现实,因此该公司计划在2026年推出“Biomemory Prime”数据中心存储解决方案,可存储 100PB 数据。
不过,这也仅仅是最乐观的预期,毕竟这项技术还比较年轻,相比来说,排在它前面的还有玻璃或陶瓷存储技术。
用200公斤装下“整个世界”
DNA做成存储器,其实是一个“意外”。事实上,原本科学家事为生命科学应用而开发的DNA合成、测序和检索技术。相比传统的存储介质,DNA在信息保留时间、物理密度和体积编码容量方面都有着优势,但我们的技术还没有那么成熟。
互联网巨头微软也曾踏足这个领域,2017年,微软组建了特别技术小组,负责研发基于DNA编码技术的数据存储系统,彼时微软表示,在未来三年内,旨在研发出测试版“微缩型DNA生物存储器”。DNA容量最大且可塑性极强,能够解决爆炸式增长的数据信息与存储空间和技术不匹配的问题。
这些DNA生物存储器或许会成为每个人特制的“数据细胞器”,把全球所有电影、视频录像、照片和有价值的文档存储在每个人的DNA基因编码里,之所以能够实现这样的技术,基础在于基因编辑技术CRISPR-Cas9已趋于成熟了。
2019年,微软和华盛顿大学的研究人员又推进了DNA存储技术的发展。而后,微软还联合哈佛大学、华盛顿大学等曾一起成立了DNA数据存储联盟,推动DNA存储发展。
值得强调的是,DNA存储是国家“十四五”科技规划中明确提出要加快布局的前沿技术之一。而在美国《科学》杂志提出了未来125个科学问题中,DNA存储也是重点。
为什么大家如此关注DNA存储?这是因为数据正在以爆炸式速度增长,到2025年全球数据量会达到1750万亿字节,这些数据能耗巨大,传输体积也巨大,其中80%~90%极少被调用的“冷数据”。而且更为关键的是,信息存储在硅上,寿命大约是数十年。
DNA存储不仅密度高、能耗低,而且寿命长,能稳定保存百年、千年,极端条件下甚至可达百万年。举个例子来说,1000万块硬盘的数据,用50克的DNA就可以存储下来,而全世界440万亿字节的数据用200公斤DNA就可以存下来。
当然,这一切都是在理论中,这种技术多久才能面世,才能具备商业价值,都还是未知数。
国内轰动一时的研究
DNA是生物体内的遗传信息载体,其中腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G) 和胞嘧啶(C)4种含氮碱基按特定顺序排列以编码遗传信息。大自然,是否也遵循着什么编码规则?我们不得而知,但这样看,似乎与数学和程序有着很大的关系,科学家也从中找到了很大灵感。
1994年Adleman首先提出DNA计算模型的概念,他利用DNA碱基互补配对原则的热力学平衡过程构建了模型,以计算哈密尔顿路径问题,并取得了成功。
2004年,Okamoto等3位学者首次将数字电路与DNA计算相结合,构建DNA电路,并形成DNA逻辑门,即将不同级逻辑门通过级联的形式组成复杂的电路,最终实现通用的DNA计算,为DNA计算和组装技术实现新一代芯片组装提供了理论基础。
2009年,IBM利用DNA和纳米技术开发下一代微处理芯片,开创了DNA计算的新时代。此时,DNA计算已经具备一定战略性意义。
2023年底,海交通大学樊春海院士、王飞副教授团队一篇刊上Nature的论文也引发了巨大讨论,这标志着中国已经成功DNA计算领域取得重要进展。
DNA计算机依赖的不再是硅晶片,而是大自然数十亿年来用以编码生命蓝图的分子。这类计算机通过实验室操作来执行计算,并以DNA链式形式的数据作为输入和输出。
研究者通过集成支持通用性计算的多层DNA可编程门阵列(DPGA, DNA-based programmable gate array),展示了一种DNA集成电路(DIC)。他们发现,使用通用的单链寡核苷酸作为统一的传输信号,可以可靠地集成大规模DIC,并能最小化泄露,实现高保真度。此外对具有24个可寻址双轨门的单个DPGA进行重新配置,可以运行超过1000亿个不同的电路。
此外,为了控制分子本质上的随机碰撞,研究者设计了DNA折纸寄存器,为级联DPGA的异步执行提供了方向。他们通过三层级联DPGA(包含30个逻辑门、约500个DNA 链)组装而成的二次方程求解DIC证明了这一点。
研究者进一步证明,DPGA与模数转换器的集成可以对与疾病相关的microRNA进行分类。无明显信号衰减下集成大规模DPGA网络,这标志着迈向通用DNA计算的关键一步。
在试管里完成运算
与常规计算机相比,DNA计算潜力无限,它具有高并行、低能耗的优势。理论上,DNA每平方毫米最多可以存储1艾字节(exabyte)或10亿千兆字节。不仅如此,一滴水就能容纳数万亿DNA分子,这表明DNA计算能够并行执行海量计算的同时,只需要很少的能量。
科学家发现,DNA在一个试管里,一步就能完成1020次运算。一些电子计算机不能计算的问题,比如哈密尔顿路径问题,就可能通过DNA计算机来完成。DNA计算在未来的科学领域中,有望在优化计算、密码学、数学等领域取得突破性的创新和应用。
那么DNA是怎么计算的?它本质是利用大量不同核酸分子杂交,产生类似数学计算过程中某种组合的结果,并且根据限制条件得出约束解。
与传统的芯片蕾丝,DNA计算是由传统意义的“电路”构成的,不过这些电路是特定功能的DNA链构成的DNA电路,DNA电路中不使用任何类型的电压和电流,电路信号是DNA链的浓度或DNA链中特定片段的有无。
相比传统计算机,DNA计算机并行计算能力强,也就是说DNA可以像GPU一样,同时计算大量内容,同时DNA计算具有非常高的能量效率和存储容量。
值得一提的是,DNA不仅能实现数字电路,还能实现模拟电路。
数字电路方面,AND、OR、XOR、NOT、NAND、NOR和XNOR这些逻辑门是关键,DNA计算则以DNA链浓度作为信号,浓度高于特定阈值,则认为该信号为逻辑高,否则为逻辑低,有点类似高电平、低电平。
根据这种原理,Nielsen曾经参考FPGA的编码方式进行设计了一个自动化设计基因电路的平台Cello,设计编码方式与Verilog相似。科学家们也把这种器件叫做DPGA(高度可扩展的基于DNA的可编程门阵列,DNA-based programmable gate arrays,DPGAs)。
模拟电路方面,输入和输出信号通常用分子浓度来表示,即模拟DNA元件能够感知特定分子在具体环境中的浓度,然后通过适当的模拟计算产生固定浓度的输出信号。模拟电路中最基础的元件是晶体管,但是DNA电路无法转变为DNA晶体管电路,因此在DNA模拟电路中在行为层面上将模拟电子电路映射到模拟DNA电路。目前,科学家已经利用DNA实现了反馈控制电路、决策器、神经生物学的模数转换和数模转换等。
需要强调的是,尽管DNA计算被证实是通用计算,但DNA计算在实际应用中无法取代电子计算,最优方案是利用DNA计算实现高度并行任务,而固有的串行任务仍采用电子计算完成。同时,DNA计算发展有三方面障碍:
对大规模系统进行物理处理时会产生错误;
在PCR扩增环节存在基因突变的问题;
目前在浓度检测过程中缺少快捷高效的检测仪器。
随着生物技术不断进步,DNA越来越被人“玩出花”,随着电子技术逐渐产生瓶颈,学科交叉成了越来越领域突破瓶颈的关键。
相关文章