美华盛顿大学开发AI蛋白设计模型 实现原子上下文条件蛋白序列设计
| 来源:【字号:大 中 小】
美国华盛顿大学大卫·贝克(David Baker)团队开发出新型深度学习方法LigandMPNN,可模拟生物分子系统的所有非蛋白质成分,不仅能生成序列,还能生成侧链构象,从而可对蛋白质间相互作用进行更详细地评估。该方法已被用于设计超100种经实验验证的小分子和DNA结合蛋白,预计将在设计新的结合蛋白、传感器和酶方面得到广泛应用。相关研究成果于2025年4月14日发表在《自然·方法》期刊上。LigandMPNN的创新主要体现在如下三个方面。
(1)全局感知的分子图谱
研究人员构建了蛋白质-配体交互网络,可模拟真实生物环境,并引入两层神经网络,分别在配体内部原子间、蛋白质与配体间动态传递信息,捕捉氢键、疏水作用等关键细节,从而形成可全局感知的分子图谱。
(2)高效的侧链建模
传统方法需分步优化序列和构象,而LigandMPNN可同步预测氨基酸序列及侧链扭转角,一步到位地生成可直接评估结合力的3D模型。此外,LigandMPNN采用环形正态分布模拟侧链自由度,提升了组氨酸(金属结合的关键)等残基的构象准确性。
(3)增强的数据处理与泛化能力
在训练中LigandMPNN随机将2%~4%的蛋白质侧链视为“假配体”,增强了模型对结合位点的敏感度。此外,研究人员对输入坐标添加了高斯噪声,以防止模型死记硬背晶体结构,提升了模型对新骨架的适应力。
信息来源:
https://www.nature.com/articles/s41592-025-02626-1
https://mp.weixin.qq.com/s/vZanTA7hpma19dGkcNPDIA
https://mp.weixin.qq.com/s/JOZp_tg__s5uGUGrRiKQLQ
