哥伦比亚大学利用神经网络预测基因组中的致病因子----中国科学院网信工作网

创新与应用案例

哥伦比亚大学利用神经网络预测基因组中的致病因子

日期：2022-12-19

| 来源：【字号：大中小】

美国哥伦比亚大学的研究团队提出了一种基于图注意神经网络的新方法——图错义变异致病性预测器（gMVP），旨在有效地表示或学习所有信息源的表示，以改进对错义变异功能影响的预测。利用该方法可准确预测基因组中的致病因子，相关研究成果于11月15日发表在《自然机器智能》上。

错义变异是导致癌症和发育障碍遗传风险的主要因素，但大多数罕见的错义变异可能是良性的或仅具有较小的功能影响。因此，基于计算预测预先选择具有破坏性的错义变异是提高统计效率的必要步骤。

gMVP使用注意力神经网络，通过大量致病变异训练的监督学习来学习蛋白质序列和结构上下文的表示。它的主要组成部分是一个带有节点的图，这些节点捕获氨基酸和边的预测特征，并通过协同进化强度加权，从而能够有效地汇集来自局部蛋白质上下文和功能相关的远端位置的信息。

研究结果显示，gMVP在识别已知风险基因中的破坏性变异方面取得了更高的准确性。对深度突变扫描数据的评估表明，gMVP在识别TP53、PTEN、BRCA1和MSH2中的破坏性变异方面优于其他已发表的方法。此外，它实现了神经发育障碍病例中从头错义变异与对照组病例的最佳分离。同时，该模型支持迁移学习以优化钠和钙通道中的功能获得和损失预测。

信息来源：

https://www.nature.com/articles/s42256-022-00561-w

附件：