创新与应用案例

深度学习算法可发现整个人类基因组中的潜在治疗靶标

日期:2020-10-15

|  来源:【字号:

新泽西理工学院和费城儿童医院的研究人员通过机器学习开发了一种算法,可以帮助预测DNA甲基化的位点,这一过程可以改变DNA的活性而无需改变其整体结构。该算法可以识别出传统筛查方法可能会遗漏的致病机制。DNA甲基化参与许多关键的细胞过程,并且是基因表达的重要组成部分。甲基化错误与多种人类疾病有关。

基因组测序工具无法捕获甲基化的影响,因为单个基因看起来仍然相同。费城儿童医院应用基因组学研究中心主任Hakon Hakonarson表示:“以前,开发用于鉴定基因组中甲基化位点的方法只能在给定的时间查看某些核苷酸长度,因此错过了许多甲基化位点。我们需要一种更好的方法来鉴定和预测甲基化位点,该工具可以在整个基因组中识别出可能引起疾病的这些基序。”计算机科学家,该研究的资深合著者新泽西理工学院的Zhi WeiHakonarson的团队合作开发了一种深度学习算法,该算法可以预测甲基化位点的位置,从而帮助研究人员确定对某些邻近基因的可能影响。

真核生物中N6-腺嘌呤(6mA)DNA甲基化的研究近来备受关注,最近的研究已经产生了大量的6mA基因组数据,然而DNA 6mA在真核生物中的作用仍然难以捉摸,甚至存在争议。Hakonarson的团队认为,真核生物中DNA 6mA的稀少性、目前生物技术对6mA检测的局限性和6mA调控机制的复杂性共同对了解DNA 6mA的作用机理提出了巨大的挑战。为了利用现有的6mA基因组数据应对这一挑战,Hakonarson的团队开发了一种基于深度学习的算法,从单核苷酸分辨率的序列中重新预测潜在的DNA 6mA位点,并应用于拟南芥、黑腹果蝇和大肠杆菌三种代表性模式生物。大量的实验证明了算法的准确性,以及与传统的基于k-mer的方法相比的优越性能。

此项研究中的计算密集型研究工作是在美国国家科学基金会通过XSEDE项目支持的超级计算机上完成的。

来源:《Nature》

附件: