美研究人员开发出类ChatGPT的蛋白质大语言模型
| 来源:【字号:大 中 小】
美国麻省理工学院和塔夫茨大学研究人员设计出一种基于大型语言模型(如ChatGPT)的人工智能算法——ConPlex,可分析大量文本,找到最可能出现在一起的组合,将目标蛋白与潜在的药物分子相匹配,而无需执行计算分子结构的密集型步骤。相关研究成果于2023年6月8日发表在《美国国家科学院院刊》上。
药物研发成本之所以如此高昂,部分原因是它的失败率很高。如果能事先预测这种结合不可能奏效,就能减少失败率,从而大大降低新药开发的成本。
ConPLex利用预先训练的蛋白质语言模型(PLex),结合蛋白质锚定的对比共嵌入(Con),实现通过蛋白质语言空间的对比学习来预测药物和目标蛋白质之间的相互作用。利用ConPlex研究人员可在一天内筛选超过1亿种化合物,超越了目前最先进的算法。
信息来源:
https://www.pnas.org/doi/10.1073/pnas.2220778120