DeepMind等团队发布高精度基因表达预测模型Enformer
| 来源:【字号:大 中 小】
DeepMind联合谷歌旗下生物科技公司Calico,开发了一种结合DNA远端交互进行基因表达和染色质状态预测的神经网络架构Enformer,能够一次编码超过20万个碱基对,大幅提高了根据DNA序列预测基因表达的准确性。为进一步研究疾病中的基因调控和致病因素,研究人员还公开了他们的模型及其对常见遗传变异的初步预测。相关研究成果于10月4日发表在《自然 方法》杂志上。
与现有的计算模型相比,Enformer整合了来自基因组的远端(大于100kb)交互信息,仅利用DNA序列作为输入,就可以不局限于保守增强子,预测激活/抑制突变以及遗传变异对细胞类型特异性基因表达的影响。这些进步和优势将促进人们对基因调控的理解,并促进开发诊断遗传性疾病的工具。此外,Enformer结合了直接从DNA序列预测增强子-启动子相互作用的方法,使得精细映射人类疾病成为可能。
信息来源:
https://www.nature.com/articles/s41592-021-01252-x
https://deepmind.com/blog/article/enformer