哥伦比亚大学利用神经网络预测基因组中的致病因子
| 来源:【字号:大 中 小】
错义变异是导致癌症和发育障碍遗传风险的主要因素,但大多数罕见的错义变异可能是良性的或仅具有较小的功能影响。因此,基于计算预测预先选择具有破坏性的错义变异是提高统计效率的必要步骤。
gMVP使用注意力神经网络,通过大量致病变异训练的监督学习来学习蛋白质序列和结构上下文的表示。它的主要组成部分是一个带有节点的图,这些节点捕获氨基酸和边的预测特征,并通过协同进化强度加权,从而能够有效地汇集来自局部蛋白质上下文和功能相关的远端位置的信息。
研究结果显示,gMVP在识别已知风险基因中的破坏性变异方面取得了更高的准确性。对深度突变扫描数据的评估表明,gMVP在识别TP53、PTEN、BRCA1和MSH2中的破坏性变异方面优于其他已发表的方法。此外,它实现了神经发育障碍病例中从头错义变异与对照组病例的最佳分离。同时,该模型支持迁移学习以优化钠和钙通道中的功能获得和损失预测。
信息来源:
https://www.nature.com/articles/s42256-022-00561-w