创新与应用案例

AlphaFold蛋白质结构预测量突破2亿

日期:2022-08-30

|  来源:【字号:

 

2022728日,DeepMind公司与欧洲生物信息研究所(EMBL-EBI)的合作团队宣布,AlphaFold预测出约100万个物种的2亿多个蛋白质结构,几乎涵盖了所有科学已知的蛋白质。相关研究成果发表在《自然》杂志上。

AlphaFold数据库于一年前推出,这个数据库涵盖了人类和20种常用模式生物的35万个蛋白质结构,并且对98.5%的人类蛋白质结构进行了准确预测。根据EMBL-EBI的数据,超过2.14亿个预测中约有35%被认为是高度准确的,这意味着它们与实验确定的结构一样好。另外45%被认为对于许多应用来说足够准确。现在发布的2亿个预测是基于另一个名为UniProt的数据库中的序列。即使包括几乎所有已知的蛋白质,AlphaFold数据库也需要随着新生物的发现而更新。随着新的结构信息的出现,AlphaFold的预测也可以得到改进。

首尔国立大学的计算生物学家Martin Steinegger表示,要应用扩展AlphaFold数据库的一些复杂应用程序,依赖于下载其整个23TB的内容,这对许多团队来说是不可行的。他的团队共同开发了一个名为FoldSeek的软件工具,该工具可以快速找到结构相似的蛋白质,并且还应该能够大大压缩AlphaFold数据。

信息来源:

https://www.nature.com/articles/d41586-022-02083-2

https://www.deepmind.com/blog/alphafold-reveals-the-structure-of-the-protein-universe

附件: