欧洲核子研究中心支持新开放数据政策
| 来源:【字号:大 中 小】
2020年12月11日,大型强子对撞机的四个主要合作组织(ALICE、ATLAS、CMS和LHCb)一致通过了一项新的大型强子对撞机(LHC)科学实验开放数据政策,该政策今天提交给欧洲核子研究中心(CERN)理事会。该政策承诺公开发布大型强子对撞机实验收集的所谓3级科学数据,即进行科学研究所需的数据类型。数据将在收集后约5年开始发布,目标是在相关实验结束前公开全部数据集。该政策针对的是日益增长的开放科学运动,其目的是使科学研究更具可重复性、可访问性和协作性。
发布的3级数据可以促进粒子物理学的科学研究,以及科学计算领域的研究,例如改进基于机器学习技术的重建或分析方法,这种方法需要丰富的数据集进行训练和验证。
“开放数据政策反映了CERN对开放科学的承诺,这在60多年前的《CERN公约》中就已经申明了。”CERN研究和计算主任Eckhard Elsen说。“该政策规定了在CERN实施该政策的具体步骤,这将使数据可供广大科学界以及公众使用。”
科学数据被认为具有不同的复杂程度。第3级数据属于大多数物理学研究的输入类型,将与使用数据所需的软件和文档一起发布。它的发布将使不同群体能够进行高质量的分析:非CERN科学家、其他领域的科学家、教育和外联活动以及普通公众。
该政策还包括1级和2级数据集的发布,其中的样本已经可以获得。第1级对应于科学文章中发表的结果的辅助信息,第2级对应于为教育和外联目的设计的专用科学数据集。
在实践中,科学数据集将通过CERN的开放数据门户发布,该门户已经容纳了一套与大型强子对撞机和其他实验有关的全面数据。数据将使用FAIR标准提供,这是一套数据准则,确保数据的可查找、可访问、可互操作和可重复使用。
CERN此前与高能物理开放出版资助联盟(SCOAP3)一起开创了科学文献开放获取的先河,SCOAP3联盟是一个由来自46个国家的图书馆、资助机构和研究机构以及政府间组织组成的全球合作伙伴关系,是目前世界上最大的开放获取计划。此外,欧洲核子研究中心还与欧盟委员会和教科文组织等许多组织合作,努力促进粒子物理学以外的开放科学实践。
来源:欧洲核子研究中心