创新与应用案例

科学家利用联合深度学习优化代谢组学研究

日期:2022-08-30

|  来源:【字号:

 

代谢组学研究受到许多外部因素导致的批次效应的挑战。深度学习技术可以从一个已知的批次训练一个诊断网络,然后将其推广到一个新的批次。然而,由于两个批次可能高度不匹配,批次效应不可避免地阻碍了这种努力。2022710日,上海交通大学和上海科技大学的研究人员提出了一个基于MALDI MS的代谢组学批量效应去除与分类的联合深度学习,相关研究成果发表在《BMC Bioinformatics》。

新提出的端到端的深度学习框架,用于去除联合批量效应,然后根据代谢组学数据进行分类。该框架由三个相互密切联系的主要网络组成:(1)给定单个输入批次的代谢组学数据,通过校准器使它们在潜在特征空间中对齐;(2)一个后续的判别器从潜在空间中推导出来,在训练中受某个批次的已知标签监督,完成对另一个测试批次的分类;随后来自潜在空间的判别器在某批已知标签的监督下训练,完成对另一测试批次的分类。(3)同样源自潜在特征空间的重构器提取并恢复所有输入批次,确保所有输入批次在整个网络中都得到很好的学习。

研究人员首先在公共CyTOF数据集上进行模拟实验验证所提出的深度学习框架,同时直观地比较了t-SNE分布,结果证明该方法有效地消除潜在空间中的批次效应。然后,在私有MALDI MS数据集上,该方法取得了最高的诊断准确性,比当前最先进的方法平均提高了5.1~7.9%。两个实验均得出结论,该方法在分类方面的表现明显优于传统方法,这得益于有效去除批次效应。

信息来源:

https://mp.weixin.qq.com/s/Pnf-b1hcSVFzR3sGHqdqyQ

附件: