数智化科研

美华盛顿大学开发AI蛋白设计模型 实现原子上下文条件蛋白序列设计

日期:2025-04-17

|  来源:【字号:

美国华盛顿大学大卫·贝克(David Baker团队开发出新型深度学习方法LigandMPNN可模拟生物分子系统的所有非蛋白质成分,不仅能生成序列,还能生成侧链构象,从而可对蛋白质间相互作用进行更详细地评估该方法已被用于设计超100种经实验验证的小分子和DNA结合蛋白,预计将在设计新的结合蛋白、传感器和酶方面得到广泛应用。相关研究成果于2025414日发表在《自然·方法》期刊上。LigandMPNN创新主要体现在如下三个方面。

1)全局感知的分子图谱

研究人员构建了蛋白质-配体交互网络,可模拟真实生物环境,并引入两层神经网络,分别在配体内部原子间、蛋白质与配体间动态传递信息,捕捉氢键、疏水作用等关键细节,从而形成可全局感知的分子图谱。

2)高效的侧链建模

传统方法需分步优化序列和构象,而LigandMPNN同步预测氨基酸序列及侧链扭转角,一步到位地生成可直接评估结合力的3D模型。此外,LigandMPNN采用环形正态分布模拟侧链自由度,提升组氨酸(金属结合的关键)等残基的构象准确性。

3)增强的数据处理与泛化能力

在训练中LigandMPNN随机将2%4%的蛋白质侧链视为假配体,增强模型对结合位点的敏感度。此外,研究人员对输入坐标添加高斯噪声,防止模型死记硬背晶体结构,提升了模型对新骨架的适应力。

信息来源:

https://www.nature.com/articles/s41592-025-02626-1

https://mp.weixin.qq.com/s/vZanTA7hpma19dGkcNPDIA

https://mp.weixin.qq.com/s/JOZp_tg__s5uGUGrRiKQLQ


附件: