【科学时报】信息化让科研更“容易”
| 来源:【字号:大 中 小】
坐在北京的办公室里,远在千里之外的西藏当雄生态试验站的工作情况便可尽收眼底;挥动一下鼠标,野外台站监测的数据就能立马显现出来……这在几年前是无法想象的。
“过去从野外数据的收集处理到传回北京中心大约需要1年的周期,花费大量的人力、财力不说,数据经常丢失是让人最头疼的事。”中国科学院地理科学与资源研究所拉萨生态试验站站长何永涛由衷感慨。
这种现象的改变得益于中国陆地生态系统碳收支集成研究的e-Science(科研信息化)环境建设的推进。
不仅仅是野外考察,“十一五”期间,中科院以应用需求为出发点,在天文e-VLBI观测、宇宙起源、气候模拟等多方面开展了一系列的e-Science应用探索,并集中在基础、资环、生物、高技术四大领域部署实施了14个e-Science示范应用项目。
“利用遥感数据采集、高速网络传输、超级计算环境、协同工作平台等信息化手段,使一些以前无法开展的工作成为可能,提高了科学研究的效率和水平,促进了科技创新能力的提升。” 中国科学院副秘书长谭铁牛在谈到科研信息化时如是说。
谭铁牛认为,信息化对传统科研行为方式的变革和对科技创新跨越式发展的助推作用已开始显现。
让科研变得更便捷高效
西藏生态试验站位于西藏当雄地区,距离拉萨市区将近200公里,以前,科研人员每隔20天才能驱车前往观测站,取回野外观测数据。
“遇上风雪天,20天也不能去一次,之前的数据就会丢失。” 何永涛说。
中科院地理所副研究员、中国生态系统研究网络综合研究中心副主任何洪林告诉记者,由于当时观测设备的存储容量只有20天,超过20天,仪器就会自动刷新。
近年来,中科院地理所与中科院网络中心合作积极推动服务于生态系统碳收支集成研究的e-Science环境建设。在中国陆地生态系统通量观测研究网络(ChinaFLUX)基本上完成了从元数据国家标准、数据资源体系和数据信息系统三部分内容的建设,形成了具有自己特色的数据管理体系;同时也建立了通量数据库和基于MATLAB平台的通量数据处理系统;并且在部分台站开展了传感器网络建设和应用试点研究。
截至目前,广东鼎湖山、西藏当雄等7个ChinaFLUX台站,都实现了从通量塔到台站的有线或者无线的传输网络的建设,为通量、视频、图片等数据的有效传输提供支持。
“科研人员的野外工作强度大大降低,获取非生长季期间通量观测数据的难题也得到了解决。” 中科院地理所研究员、国家生态系统观测研究网络综合研究中心主任、中国生态系统研究网络综合研究中心主任于贵瑞表示。
e-VLBI是e-Science的另一个示范应用项目。2004年起,经过三年时间,中科院VLBI测轨分系统全面完成了对原VLBI天文测量系统的信息化改造。
上海天文台VLBI研究室副主任郑为民介绍,e-VLBI通过高速互联网,将分布于北京、上海、昆明和乌鲁木齐的四座观测站以及上海天文台的数据处理中心,连结成分辨率相当于口径为3000多公里的巨大综合射电望远镜,测角精度可以达到百分之几角秒。
在嫦娥一号工程关键任务段,e-VLBI得以准实时的处理方式快速提供测量数据,滞后时间多数小于5分钟,这一结果远远优于原计划中10分钟的滞后上限。
而在嫦娥二号发射期间,经过升级后的e-VLBI 网再次以准实时方式对卫星进行精密测量,大部分数据滞后时间缩短至3分钟。
造就全新的科研模式
虚拟天文台可以说是最早开展e-Science探索的项目。早在2002年,依托中科院大天区面积多目标光纤光谱天文望远镜(LAMOST)大科学工程,以国家天文台为主的国内天文学家提出了中国虚拟天文台(China-VO)研究开发计划。2002年,China-VO加入国际虚拟天文台联盟。
今年10月,LAMOST开始进行巡天观测,每晚约能拍到上万的天体光谱。
LAMOST观测运行部施建荣告诉记者,他们就是利用虚拟天文台对LAMOST的观测数据进行批量发布。
“全球的天文信息都可以通过虚拟天文台这个平台进行共享。”中科院国家天文台信息与计算中心主任崔辰州说。
所谓虚拟天文台就是通过先进的信息技术将全球范围内的天文研究资源无缝透明地连结在一起形成的数据密集型网络化天文研究和科普教育环境。
“传统的科研模式被打破。”崔辰州认为。
“如同一棵大树,树根就是各种数据获取点,各种数据会聚到树干,各个课题组如同树枝一样充分利用这些数据,通过讨论研究,最后开花结果。” 前LAMOST项目总经理赵永恒比喻说。
没有国界的科技合作
2010年3月,欧洲大型强子对撞机LHC开始运行,全世界有6000多名科学家参加了LHC实验,中国多个研究机构与大学参加了LHC上的ATLAS和CMS两个大型实验。
LHC每年能产生超过15PB的数据。“这是目前世界上最大最前沿的高能物理实验,也是一个全新的高能物理领域的国际合作。”中科院高能物理研究所计算中心主任陈刚介绍。
数据密集型网格平台是中科院在基础前沿领域的e-Science的重要示范应用项目。在2006年,数据密集型网格平台开始加入全球高能物理网格平台,截至2010年底,该网格平台具有1600个CPU核的计算能力,640TB的磁盘存储能力。
陈刚介绍,数据密集型网格平台是以高能物理研究所为中心站点,多个合作单位为卫星站点的联盟。作为中心站点,高能物理研究所提供计算、存储、安全等全面的网格服务,卫星站点则致力于具体科学应用的支持。例如,山东大学、南京大学及中国科技大学站点支持ATLAS等科研项目;北京大学站点支持CMS等科研项目。
同时,在中国科学院网络中心的帮助下,他们对国际网络进行了调试优化,网络链路的延时由350毫秒下降到180毫秒左右,整个国际链路的吞吐率得到了很大的改善,峰值达到1Gbps以上。
为了满足数据传输和作业调度的需求,还建立了到欧美的高速网络链接,包括中欧之间的1Gbps的链路以及中美之间的622Mbps的链路。
“我们能与全球高能物理网格平台很好地联合在一起,能参与到整个数据分析和物理计算中去。”陈刚介绍。
目前每年为ATLAS和CMS实验提供约1100万CPU小时的机时,完成400余万个计算作业,与欧美之间的数据交换每年达到600TB,为新粒子寻找及新物理研究等工作起到重要的支撑作用。
“利用数据密集型网格平台,ATLAS和CMS实验都作出了非常突出的成绩。”陈刚说,中国数据密集型网格平台已成为国际高能物理网格系统的一个重要站点。
不仅如此,利用数据密集型网格平台开展国际合作正进一步拓展。应用也从高能物理领域,扩展到生物信息领域。
(原载于《科学时报》 2011-12-02 A1 要闻)