数字技术与基础设施

瑞士苏黎世联邦理工学院开发出DNA搜索引擎

日期:2025-10-21

|  来源:【字号:

瑞士苏黎世联邦理工学院科学家开发出一款名为MetaGraphDNA搜索引擎,能快速、高效地检索公共生物学数据库中的海量信息,为分析DNARNA及蛋白质序列等原始生物学数据设立了新标准。相关研究成果于2025108日发表在《自然》期刊上。

MetaGraph的核心突破在于采用数学中的“图结构”,将相互重叠的DNA片段智能联结,原理类似于图书索引中将含有相同关键词的句子关联起来,形成知识网络。研究团队整合了7个公共资助数据库,构建出一个跨越病毒、细菌、真菌、植物、动物乃至人类的生命全谱系索引,共涵盖1880万个独特的DNARNA序列集,以及2100亿个氨基酸序列集。

基于这一庞大索引,研究团队开发出了可直接通过文本提示检索原始数据档案的搜索引擎,使研究人员能直接对“序列读取档案”等存储库提出生物学问题,该存储库本身包含超过1亿个DNA字母。

为验证其实用性,研究团队利用MetaGraph扫描了24万多个人类肠道微生物组样本,搜寻抗生素耐药性的遗传标记。研究团队仅用一台高性能计算机,约一小时便得出结果,可见MetaGraph强大的分析效率。

信息来源:

https://ethz.ch/en/news-and-events/eth-news/news/2025/10/a-dna-search-engine.html

https://www.nature.com/articles/s41586-025-09603-w

https://www.stdaily.com/web/gdxw/2025-10/10/content_413271.html


附件: