湖南大学利用深度学习实现分子性质和药物靶标预测
| 来源:【字号:大 中 小】
ImageMol整体架构可分为三个部门:
(1)分子编码器,可从约1000万张分子图像中提取潜在特征。
(2)五个预训练策略(MG3C、MRD、JPP、MCL、MIR)利用分子图像中的化学知识和结构信息来优化分子编码器的潜在表示。其中,MG3C是多粒度化学簇分类,MRD是分子合理性鉴别器,JPP是拼图预测,MCL是基于MASK的对比学习,MIR是分子图像重建。
(3)对预训练的分子编码器在下游任务中微调,以进一步提高模型性能。
ImageMol将图像处理框架与综合分子化学知识相结合,以可视化计算的方式提取精细像素级分子特征。利用ImageMol在美国国家转化科学推动中心(NCATS)发布的13个实验数据集中准确识别了抗SARS-CoV-2分子,在美国FDA批准的2501种药物中成功预测了潜在治疗新冠肺炎的3CL蛋白酶抑制剂,这表明该框架将为快速药物研发提供强大支撑。
信息来源:
https://www.nature.com/articles/s42256-022-00557-6