原标题:DENSe:DNA数据存储的新变化使用户可以预览存储的文件 来源:cnBeta.COM
来自北卡罗来纳州立大学的研究人员已经将DNA数据存储的一个长期挑战变成了一种工具,利用它为用户提供存储数据文件的预览--比如图像文件的缩略图版本。DNA数据存储是一项有吸引力的技术,因为它有可能在一个小包中存储大量的数据,它可以长期存储这些数据,并以一种节能的方式进行。
然而,直到现在,还不可能预览存储为DNA的文件中的数据--如果你想知道一个文件是什么,你必须 "打开"整个文件。
"我们的技术的优势在于它在时间和金钱方面更有效率,"关于这项工作的论文的主要作者、北卡罗来纳州的博士生Kyle Tomek说。"如果你不确定哪个文件有你想要的数据,你不必对所有潜在文件中的所有DNA进行测序。相反,你可以对DNA文件中更小的部分进行测序,作为预览。"
以下是对这一工作方式的快速概述:
用户通过将称为引物结合序列的DNA序列附加到存储信息的DNA链的末端来 "命名"其数据文件。为了识别和提取一个特定的文件,大多数系统使用聚合酶链式反应(PCR)。具体来说,它们使用一个小的DNA引物,与相应的引物结合序列相匹配,以识别含有你想要的文件的DNA链。然后,系统使用PCR制作大量相关DNA链的副本,然后对整个样本进行排序。由于该过程制作了许多目标DNA链的副本,目标链的信号比样品的其他部分更强,因此有可能识别目标DNA序列并读取文件。
然而,DNA数据存储研究人员一直在努力解决的一个挑战是,如果两个或更多的文件有类似的文件名,PCR会无意中复制多个数据文件的片段。因此,用户必须给文件起非常明显的名字,以避免得到混乱的数据。
由此,研究人员开发了一种技术,利用类似的文件名,让他们打开整个文件或该文件的特定子集。这通过在命名一个文件和该文件的特定子集时使用特定的命名规则来实现。他们可以通过操纵PCR过程的几个参数来选择是打开整个文件,还是只打开 "预览"版本:温度、样品中的DNA浓度,以及样品中试剂的类型和浓度。研究人员通过在DNA数据存储中保存四个大型JPEG图像文件并检索每个文件的缩略图以及完整的高分辨率文件来证明他们的技术。
新的 "文件预览 "技术也与DNA富集和嵌套分离(DENSe)系统兼容,研究人员创建该系统是为了使DNA数据存储更加实用。DENSe通过引入改进的数据文件标签和检索技术,有效地使DNA存储系统更具可扩展性。
该论文将于今天(2021年6月10日)发表在《自然通讯》上。这篇论文的共同作者是Elaine Indermaur,她曾是北卡罗来纳州的本科生。