在发表于《科学》(Science)的研究中,研究者 Yaniv Erlich 和 Dina Zielinski 描述了一种可以最大化 DNA 分子的数据存储能力的新编码技术。该系统能够在一克DNA中存储215PB(2.15亿GB),原则上可以将人类记录的所有数据存储在几辆卡车大小和重量的容器中。
人类面临着数据存储的难题:过去2年中产生的数据比之前人类历史产生的全部数据还要多。信息的洪流可能很快就会超过硬盘的承受力。现在好了,研究人员称,他们已经找到了一种新的方法来编码DNA中的数字数据,以创建前所未有的最高密度大规模数据存储方案。该系统能够在一克DNA中存储215PB(2.15亿GB),原则上可以将人类记录的每一点数据存储在几个卡车大小和重量的容器中。但是,这项技术能否推进可能取决于它的成本。
在发表于《科学》(Science)的研究中,Yaniv Erlich 和Dina Zielinski 描述了一种可以最大化DNA 分子的数据存储能力的新编码技术。
用DNA存储数据的优点
用DNA存储数字数据有许多优势。它是超小型的,如果保存在阴凉,干燥的地方,它可以几十万年不损坏。只要人类社会能阅读和编写DNA,就能够对其进行解码。“DNA不会像盒式磁带和CD那样随着时间的推移而衰减,它不会过期。”哥伦比亚大学计算机科学家Yaniv Erlich说。也不像其他高密度的存储方式,比如操纵表面上的个别原子,这项新技术可以一次写入和读取大量的DNA,且可以放大。
之前的工作
科学家开始使用DNA存储数字数据,要追溯到2012年。当时哈佛大学的遗传学家George Church, Sri Kosuri和其他同事使用 DNA 的四种碱基 A、G、T和C来编码数字化文件的0和1,把一本52,000字的书编码到数千个DNA片段中。然而,他们的编码方案相对低效,每克DNA仅能存储1.28PB。后来也有一些方法做得更好,但没有一个能够存储超过研究人员认为DNA实际可以处理的(每个DNA 核苷酸约1.8比特)一半的存储量。(研究人员认为每个DNA 核苷酸可以存储约1.8比特,而不是2比特,是考虑到DNA写入和读取中罕见但不可避免的错误)。
最新的研究和方法
Erlich认为他可以接近这一极限。因此,他和New York Genome Center的助理研究员Dina Zielinski研究了用于编码和解码数据的算法。他们从六个文件开始,其中包括一个完整的计算机操作系统,一个计算机病毒,一部1895年的法国电影《火车进站》,和1948信息学家Claude Shannon的一份论文。他们首先将文件转换为1和0的二进制字符串,将它们压缩成一个主文件,然后将数据拆分为二进制代码的短字符串。他们设计了一个称为DNA喷泉的算法,将这些字符串随机地打包成所谓的水滴,然后向其中添加额外的标签,以帮助以正确的顺序重新组合它们。总而言之,研究人员创建了72,000个DNA链的数字列表,每个长度为200个碱基。
Columbia University 和NewYork Genome Center (NYGC)的研究表明,设计用于手机流视频的算法可以通过压缩更多信息到四个基本核苷酸的方式解锁DNA几乎全部的存储潜力。他们同时指出,这项技术也极为可靠。
他们以文本文件的形式把这些东西发送给了Twist Bioscience,一家位于旧金山的初创公司,在那里这些文本被合成了DNA链。两周后,Erlich 和Zielinski 收到一个小玻璃瓶,里面装着编码了他们文件的DNA。为了对它们进行解码,他们使用现代DNA 测序技术,将遗传密码翻译回二进制数字,并使用标签重组了六个原始文件。根据他们在《科学》杂志上发表的报告,这种方法效果很好,新的文件没有出错。他们还能够通过聚合酶链反应(一种标准的DNA复制技术)复制几乎无限数量的无错误文件。更重要的是,Erlich说,他们能够为每个核苷酸编码1.6比特(bits)的数据,比前人研究好60%,达到了理论极限的85%。
然而,Kosuri和Erlich提到,新的方法现在还不具备大规模使用的条件。因为成本太高,合成文件中的2兆字节的数据花费了7000美元,然后读取这些数据又花了2000美元。Erlich说,随着时间推移,成本可能会下降,但这样的研究仍有很长的路要走。此外,与其他形式的数据存储相比,将数据写入DNA 以及读取其中的数据都相对较慢。因此,如果数据需要立即处理,这种方法就不太可行,这种方法更适合应用于档案。
对于成本问题的质疑
科技类网站Ars Technica 的编辑John Timmer 也指出,这一技术的问题在于每次读取数据需要花费漫长的时间和高额的成本,这一成本甚至高于将数据植入DNA 的成本。 Erlich 和 Zielinski 则指出,成本高昂是由于对于DNA 品质的苛求,直接跳过DNA 质检的步骤会直接减低成本,而他们自信随之而来的错误率则会被系统本身很好地修正。针对这一技术中高昂的DNA 合成和读取成本,UCLA 的生物化学教授Sri Kosuri 则认为投资者不会花费巨资来降低成本。
当然,John Timmer 也并不是在完全否定这一方法。相反,他指出:只要人类文明的技术确保我们还可以读取DNA和运用喷泉算法,那么这些数据永远都是可以被读取的。任何其他形式的数据存储恐怕都无法保证这点。当然如果人类文明已经倒退到无法完成上述工作的地步,那这些数据对我们已经毫无意义了。
原文:http://www.sciencemag.org/news/2017/03/dna-could-store-all-worlds-data-one-room;https://phys.org/news/2017-03-short-movie-dna.html
来源: 战略前沿技术
删除或更新信息,请邮件至freekaoyan#163.com(#换成@)
Science: DNA存储技术可最大化_青岛生物能源与过程研究所
青岛生物能源与过程研究所 免费考研网/2017-12-08
相关话题/数据 技术 人类 数字 科学
柔性太阳能光伏发电与储存技术的研究进展_青岛生物能源与过程研究所
欧盟第七研发框架计划提供400万欧元,总研发投入550万欧元,由英国、意大利、西班牙、葡萄牙、比利时、丹麦和瑞士的15家太阳能企业组成欧洲Powerweave研发团队,长期从事太阳能光伏发电与储存技术的开发及应用。 Powerweave团队在成功开发出基于染料敏化纤维材料太阳能光伏电池技术和基于电 ...青岛生物能源与过程研究所 青岛生物能源与过程研究所 免费考研网 2017-12-08国家能源局 《能源技术创新“十三五”规划》_青岛生物能源与过程研究所
国家能源局1月份对外发布的《能源技术创新“十三五”规划》(以下简称《规划》)提出,“十三五”期间将集中力量突破重大关键技术、关键材料和关键装备,实现能源自主创新能力大幅提升、能源产业国际竞争力明显提升,能源技术创新体系初步形成。《规划》是《能源技术革命创新行动计划(2016-2030年)》在“十三五 ...青岛生物能源与过程研究所 青岛生物能源与过程研究所 免费考研网 2017-12-08欧盟软物质纳米技术研究动向_青岛生物能源与过程研究所
为确保资源的有效利用和生态环境可持续,欧盟软物质纳米技术在各行各业的商业化应用正在快速发展,其研发目前处于世界领先水平。欧盟第七研发框架计划提供780万欧元,总研发投入970万欧元,由德国、英国、西班牙、比利时、荷兰、瑞典、芬兰、希腊、波兰和瑞士10个国家的科研机构联合工业界组成ESMI研发团队,从 ...青岛生物能源与过程研究所 青岛生物能源与过程研究所 免费考研网 2017-12-08科学家提出编码基因重建新方法_青岛生物能源与过程研究所
中科院北京生命科学研究院计算基因组学实验室研究员赵方庆团队提出一种基于密码子deBruijn图的新算法,使用非拼接策略直接对转录组测序数据进行编码基因识别和重建,解决了编码基因识别效率低且不完整的难题,该方法在非模式生物的进化基因组研究领域具有很大的应用前景。该成果已在线发表在《基因组生物学》上。 ...青岛生物能源与过程研究所 青岛生物能源与过程研究所 免费考研网 2017-12-08Nat Commun:科学家成功绘制出人类DNA中的“暗物质”信息_青岛生物能源与过程研究所
安交通大学、萨尔兰大学等机构的研究人员通过研究在深入理解人类基因组上取得了突破性的进展,在250个荷兰家庭中鉴别出大型的DNA突变后,研究人员发现了基因组中部分DNA“暗物质”,相关研究或可帮助全球的研究人员对DNA突变体进行研究,并且利用相关研究结果更好地理解遗传性疾病的发生机制,研究成果发布与N ...青岛生物能源与过程研究所 青岛生物能源与过程研究所 免费考研网 2017-12-08复旦俞燕蕾团队研发光控微流体新技术 成果发表于《自然》杂志_青岛生物能源与过程研究所
9月8日,复旦大学材料科学系与聚合物分子工程国家重点实验室俞燕蕾教授团队在《自然》(Nature)杂志发表关于光控微流体领域的最新研究成果。 俞燕蕾团队采用自主研发的新型液晶高分子光致形变材料,构筑出具有光响应特性的微管执行器,在几平方厘米的芯片上,通过光操控各种液体的复杂流动,令其蜿蜒而行甚至爬 ...青岛生物能源与过程研究所 青岛生物能源与过程研究所 免费考研网 2017-12-08解析《中国科学院“十三五”发展规划纲要》_青岛生物能源与过程研究所
为做好规划纲要的宣贯工作,现以“问答”方式就规划纲要的编制工作、总体考虑和指导思想、主要目标任务、重点改革举措等大家可能关心关注的相关内容,进行简要介绍,以帮助大家增进对规划纲要的了解。 1.中科院“十三五”规划纲要编制工作经过哪些环节?有哪些主要特点? 中科院“十三五”规划纲要编制工作历时两年 ...青岛生物能源与过程研究所 青岛生物能源与过程研究所 免费考研网 2017-12-08美国能源部发布《国家藻类生物燃料技术综述》报告_青岛生物能源与过程研究所
自2010年《国家藻类生物燃料技术路线图》发布以来,在藻类生物燃料的研发方面已经取得了很多的成就,美国能源部就此编写了《国家藻类生物燃料技术综述》报告,总结了所取得的进步,同时也对新的挑战、发展中的经验和下一步发展方向进行了阐述,报告2016年6月26日发布。 报告主要分为以下10个部分:藻类生物 ...青岛生物能源与过程研究所 青岛生物能源与过程研究所 免费考研网 2017-12-08科学家彻底改写细菌基因组_青岛生物能源与过程研究所
合成生物学家报告了迄今为止意义最为深远的一项细菌基因组重写结果。这一进展包括重新利用了大肠杆菌3.8%的碱基对。研究人员在8月18日出版的美国《科学》杂志上发表了这一研究成果。 研究人员换下了大肠杆菌64个遗传密码子(为氨基酸指定遗传代码的序列)中的7个。他们如今能够通过在55个片段(每一个片段的 ...青岛生物能源与过程研究所 青岛生物能源与过程研究所 免费考研网 2017-12-08七项改变世界的化学分离技术_青岛生物能源与过程研究所
如今,以热能为基础的工业化学分离过程(例如,蒸馏)所消耗的能量占到了全球年均能量消耗的10%~15%。因此,提高分离技术,在生产燃料、塑料、食物等产品的过程中节约能量,将大大缓解全球的能源紧张局势。 最近,《自然》(Nature)刊登了一篇评论,来自佐治亚理工学院(GeorgiaInstitute ...青岛生物能源与过程研究所 青岛生物能源与过程研究所 免费考研网 2017-12-08