我国发布全球首个百亿级可部署基因组基础模型
| 来源:【字号:大 中 小】
2025年10月23日,华大生命科学研究院与之江实验室联合发布全球首个百亿参数可部署的基因组通用基础模型Genos。该模型可支持高达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。这一成果被视为基因组研究领域的一个重要转折点,标志着基因组研究正从“读取”基因序列,走向“理解”生命底层逻辑,有望为疾病诊断、基因药物研发、个人基因组解读及生命科学研究带来突破性变革。目前,该模型已在抱抱脸(HuggingFace)、魔搭等平台全面开源开放,提供12亿和100亿参数两个版本,满足不同需求。
Genos整合了人类泛基因组参考联盟(HPRC)、人类基因组结构变异图谱计划(HGSVC)等多个权威公开资源,首次将全球范围内636个“端粒到端粒”级别的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,有助于更全面理解人类遗传多样性。
算法架构方面,Genos通过“混合专家”架构,精准调度强相关“专家”算法协同处理,在汇总百亿级庞大参数时成功降低推理成本和资源消耗,让模型既强大、又好用。
测试结果显示,Genos在直接面向临床应用的致病性突变解读任务中,准确率达92%;结合科学基础模型后,准确率高达98.3%。多项综合评测结果也显示,Genos超越现有最佳水平模型。
信息来源:
https://news.cctv.com/2025/10/23/ARTITxjvD9fXcMuS8UVAx6yp251023.shtml
