【中国科学报】“微”生物 “大”数据
| 来源:【字号:大 中 小】
在不久的将来,微生物大数据将有大作为。数据是信息化时代的“石油”,基于大数据的研究和信息发现已经成为生命科学研究新范式,不断改变着生物产业格局,催生产业新业态。
在“微”与“云”都很时髦的当下,最近,中国科学院微生物研究所也赶了一把“潮流”——他们承接的“863”计划“微生物数字化信息系统集成关键技术项目”正是“微”与“云”的结合。
“简单来说,这个项目将通过研究和开发云环境下微生物数据存储和计算等一系列关键技术,形成完善的微生物数字资源体系、知识发现平台和大数据服务平台,建立具有国际影响力的微生物数据库,实现我国微生物领域数字资源建设的突破。”项目首席专家、中国微生物所信息中心主任兼世界微生物数据中心主任马俊才向《中国科学报》记者介绍说。
当下,微生物大数据正在筑起一道坚固的数据高墙,它需要科研团队用创新思维进行管理。中国科学院生物物理研究所陈润生院士在肯定科技人员对该项目的付出后给予鼓励,他建议该项目不断创新,以实用为基础作出自身特色。
发展带来的挑战
微生物学的不断发展给数据集成和应用带来挑战。
马俊才介绍说,微生物是生命科学研究不可替代的基本材料,对科技创新和产业发展有重要的价值。传统微生物资源数据整合是以资源数据、样本数据为主,且数据量小、复杂程度低,对整合度要求低,对数据的应用分析需求也少。
目前,生物学已经从传统向综合生物学迈进,在数据要求上对性状功能数据、组学数据、酶数据、代谢网络数据等都有更多的应用,数据复杂度高、数据量大,对数据分析和处理及整合的要求,亟待新的数据分析方法和平台来满足。
“综合性的微生物大数据对微生物学研究和微生物资源利用有着至关重要的作用。”马俊才说。
随着信息技术的发展,我国微生物大数据研究步入世界前列。记者了解到,隶属于世界菌种保藏联合会(WFCC)的世界微生物数据中心(WDCM)已于2010年转移到中科院微生物所,成为中国生命科学领域的第一个世界数据中心。该中心是全球70多个国家673个微生物资源保藏机构的数据总中心,也是全球最重要的微生物实物资源数据平台。
为了进一步对数据开展更深入系统的研究,推进世界微生物数据共享,在“863”计划立项支持下, 由中科院微生物所、上海生物信息技术中心、中科院上海生命科学研究院、中国医学科学院医药生物技术研究所以及哈工大共同完成。
马俊才介绍道,目前,该项目在共享与应用示范,分析模型及报告,微生物大数据仓库和共享政策、标准规划四方面均有进展。
“我们完成了微生物数据共享和利用政策初步调研。”他说。数据共享管理计划本质上解决了收集哪些数据(数据类型)、如何录入数据(数据标准)、何时何地保存(存档与保存计划)、管理以及怎样公开共享(获取与共享政策)等核心问题。
未来,科研人员还将完成微生物领域数据共享政策与标准规范研究报告。
国际合作新平台
包括马俊才在内的许多科研人员相信,在不久的将来,微生物大数据将有大作为。他们认为,数据是信息化时代的“石油”,基于大数据的研究和信息发现已经成为生命科学研究新范式,不断改变着生物产业格局,催生产业新业态。
在马俊才看来,虽然目前微生物大数据炙手可热,但对其挖掘和应用还存在许多问题,包括数据整合的方式、数据的质量控制、各种数据类型的数据标准、新型的数据挖掘工具,以及海量数据可视化技术等。“单凭一家机构的力量,难以在微生物大数据技术上取得重大进展和突破。”
他们希望通过联合研究的方式发挥各自在数据和技术方面的优势,取得突破性成果并尽快占领国际领先地位。
自WDCM移师中国以来,马俊才他们在推进大数据的国际合作方面不遗余力。
2012年,他们牵头倡议并推动了全球微生物资源目录国际合作计划(GCM)。这项计划集腋成裘——旨在为分散于全球各个保藏中心和科学家手中的宝贵的微生物资源提供一个全球统一的数据仓库,并以统一数据门户的形式,对全世界科技界和产业界提供微生物菌种资源的信息服务。据介绍,这个仓库里目前保管着32个国家及地区的64个微生物资源研究和保藏机构的近29万株微生物实物资源的采集、分离、保藏、应用及文献专利信息,其中不乏来自特殊生态环境、具有重要的科研和工业应用价值的微生物。
这个被马俊才称为“宝藏”的平台还利用先进的数据挖掘手段,开发了基于微生物实物资源的知识挖掘工具,整合目前已经发表的来自文献、专利、国际生物信息学数据库的数据,并提供了一系列数据分析和可视化的工具,从全球超过600万已发表的微生物文献及专利中,进一步提取了微生物资源的后续研究和利用的信息。
“这个‘宝藏’对微生物实物资源从采集、保藏、跨国转移、学术和商业应用以及利益分享的各个环节都能提供有效的数据支持。”马俊才说。
在这些项目和平台的支撑下,2014年,中国科学家又推动了国际微生物大数据联合研究中心的建立。成立仪式上,WFCC理事会主席Philippe Desmeth发来了贺信和视频讲话,希望今后加强与该大数据中心的合作。
而在马俊才他们看来,微生物的大数据之路,才刚刚开始。