数智化科研

北京大学利用AI实现人类蛋白质重要性的预测分析

日期:2024-12-19

|  来源:【字号:

北京大学崔庆华团队通过微调预训练的蛋白质语言模型,开发了一个基于序列的深度学习模型——蛋白质重要性计算器(PIC),为蛋白质重要性预测提供了新思路。相关研究成果于20241127日发表在《自然·计算科学》期刊上。

PIC包含三个主要模块:Embedding模块,使用ESM-2预训练模型提取蛋白质序列特征;Attention模块,捕捉氨基酸序列中不同位置的相对重要性;Prediction模块,预测蛋白质的必需性概率。

PIC是首个可以同时预测蛋白质在人体、人源细胞系和小鼠中的重要性的评分工具,能够针对人类所有蛋白质的重要性进行综合的预测评估。研究结果显示,PIC在性能上相较于目前最先进的计算方法DeepCellEss有了显著提升。在案例研究中,研究团队还使用PIC算法成功预测了人类乳腺癌中的关键蛋白质靶点,并证明了其作为乳腺癌患者预后标志物的价值。

信息来源:

https://www.nature.com/articles/s43588-024-00733-1

https://www.thepaper.cn/newsDetail_forward_29519168

https://mp.weixin.qq.com/s/vs0HAOfqR4FyQ-8cObtooQ


附件: