我国DNA信息存储取得新突破!实现60MB生物医学图像存储读取

作者:拓荒牛 分类:默认分类 时间:2025-05-23 14:03
开说 - 企业数字化部

封面新闻记者 谭羽清 图片由被访者提供

信息存储记录历史,传承文明,在人类社会发展中扮演着重要角色。随着科技发展,信息存储的方式与技术也在不断推陈出新。

近日,我国科研人员在DNA信息存储领域取得新突破,研发了一种全新的DNA存储系统——HELIX,该系统专门用于存储生物医学数据,成功实现了将两张共60MB的时空组学图像编码为13万条、每条183个碱基的DNA序列,并通过DNA合成与测序技术,恢复图像数据。

本次实验存储两张图片所合成的DNA样本

这一科研成果由天津大学应用数学中心吴华明教授团队取得,并在近期于国际学术期刊《自然-计算科学》上在线发表。

DNA存储技术如何实现?有何优势?或将率先用于储存哪些数据?相关技术将如何更新迭代?5月22日,封面新闻记者对话了吴华明教授团队成员、天津大学应用数学中心博士生曲冠锦。

将信息存入DNA

保存时长达数千年

“常见的硬盘存储主要是依靠磁性电流来保存信息,而DNA存储则是利用了DNA分子来存储信息,使用了碱基中的A、T、G、C来表示信息中的0、1、2、3。”

据曲冠锦介绍,DNA存储与读取的过程大致来说即是一个“编码”与“解码”的过程。在存储时,需要将储存信息编码为组成DNA的碱基ATGC序列,然后使用仪器把这些编码合成为真实的DNA分子。在需要提取这些信息时则会通过对这些DNA分子进行测序,将它们的ATGC序列在电脑上进行解码,最终得到从前存储的信息。

由于DNA的特性,其作为存储介质具有存储密度高、保存时间长、无需电力保存等优势,“DNA分子可以脱水变成干粉形态来保存,每克DNA能够存储数百艾(EB)字节的数据,存储密度高。根据以往研究,化石中发现的DNA分子也能够读取,这意味着它们能在干燥的环境下至少能保存上千年。最关键的是,DNA分子无需通电保存,对存储环境要求较少。”

课题组部分成员合照

存储生物医学数据之后

技术或将应用于这些领域

近期发布的DNA存储系统HELIX专用于存储生物医学数据,在曲冠锦看来,其或将最先被用于医学影像数据的保存,比如核磁共振、X光、CT等检查得到的影像。

“随着医疗水平的进步,医学影像数据也在日渐增多。而我们认为它们的使用场景和DNA存储匹配。对于病人来说,这些资料可能在一次诊疗后的数年内都不会用到,但是又不能丢失,以防病情复发时复诊需要使用。所以可以存储在DNA中以备不时之需。”曲冠锦解释道。

除了应用于生物医学领域,曲冠锦表示所在团队还希望推动HELIX应用于更多领域,“对于背景比较纯净的数据,如深空图片、显微图片等,HELIX都有较好的存储效果。”而团队也将积极开展跨学科合作,让DNA存储技术能惠及更多领域,例如与天津大学图书馆合作,探索书籍的DNA存储方案,与建筑学院携手,进行古建筑和古籍的DNA保存工作。

加快读写速度、实现随机读写……

未来DNA存储技术将再升级

据悉,HELIX系统包含三个核心模块:图像压缩、图像纠错编码和图像复原修复。针对DNA存储过程中可能出现的碱基错误,HELIX对现有压缩算法进行了优化,大幅增强了系统的容错能力。

同时,为了进一步提升图像解码的成功率,研究团队还引入了深度学习技术,在图像修复过程中显著增强了信息恢复的能力,“目前DNA存储有一定的错误率,一旦出现错误且未能恢复成功,可能导致读取图片损坏。因此我们引入基于深度学习的图像修复算法,可以在图像损坏时预测损坏部分内容,进而提高图片可读性。”

对于未来,曲冠锦表示所在团队还将在HELIX技术基础上做进一步升级,包括提升DNA存储的读写速度、实现数据的随机读取等。他举例,当前一次性用DNA存储3张图片后,如果要读取第三张图片,需要将这三张图片一起读取,因此团队计划后续引入新机制,实现随机读取DNA存储中的任意所需数据。

当前用户暂时关闭评论 或尚未登录,请先 登录注册
暂无留言
版权所有:拓荒族 晋ICP备17002471号-6