北京大学利用AI实现人类蛋白质重要性的预测分析
| 来源:【字号:大 中 小】
北京大学崔庆华团队通过微调预训练的蛋白质语言模型,开发了一个基于序列的深度学习模型——蛋白质重要性计算器(PIC),为蛋白质重要性预测提供了新思路。相关研究成果于2024年11月27日发表在《自然·计算科学》期刊上。
PIC包含三个主要模块:Embedding模块,使用ESM-2预训练模型提取蛋白质序列特征;Attention模块,捕捉氨基酸序列中不同位置的相对重要性;Prediction模块,预测蛋白质的必需性概率。
PIC是首个可以同时预测蛋白质在人体、人源细胞系和小鼠中的重要性的评分工具,能够针对人类所有蛋白质的重要性进行综合的预测评估。研究结果显示,PIC在性能上相较于目前最先进的计算方法DeepCellEss有了显著提升。在案例研究中,研究团队还使用PIC算法成功预测了人类乳腺癌中的关键蛋白质靶点,并证明了其作为乳腺癌患者预后标志物的价值。
信息来源:
https://www.nature.com/articles/s43588-024-00733-1
https://www.thepaper.cn/newsDetail_forward_29519168
https://mp.weixin.qq.com/s/vs0HAOfqR4FyQ-8cObtooQ