美国家科学技术委员会发布《数据基础设施与研发基础设施项目互联互通框架》建议报告
| 来源:【字号:大 中 小】
2024年12月17日,美国国家科学技术委员会(NSTC)发布《数据基础设施与研发基础设施项目互联互通框架》建议报告,旨在推进实验、知识、研究三大类基础设施融合发展,促进数据驱动的交互式研究模式,推动AI等技术爆发式增长。
该报告确定了从业者、管理者和发起人在规划、开发、运营和升级数据基础设施和互连性时应考虑的五个关键问题,探讨了开发和升级研究项目数据基础设施时面临的普遍挑战,并提出了将框架付诸实践的对策建议。
1. 关键问题
(1)数据的科学目标和任务优先级,包括研发基础设施项目的核心科学目标、采用的数据总体政策及标准等;
(2)用户和利用率,包括主要用户识别、工作流程示例、用户与数据的交互方式等;
(3)数据清单、治理和管理,包括数据使用规则和限制、数据源和数据产品特点、数据可用性要求、数据访问协议、数据风险管理等;
(4)动态数据生态系统,包括实现互操作性支持的接口和标准、将前瞻性发展因素融入研发基础设施项目生命周期、确保对新资源与服务的适应性等;
(5)项目管理和合作,包括确定数据利益相关者和合作实施协议。
2. 普遍挑战
(1)大规模数据的传输和管理,包括分布式站点数据存储、共享和传输流程创建,低延时和交互性数据流的实现,数据传输能力有限情况下源头数据现场分析等;
(2)数据集成和数据基础设施的互操作性,包括互操作性通用模式的实现、可扩展性和自动化、互操作治理方法、标准和格式不兼容问题等;
(3)在商业云中的运营,包括预期的成本,云和本地服务的兼容性和差异性,运营的连续性和灵活性;
(4)敏感和安全数据处理,包括与合作伙伴的数据共享治理机制、数据风险评估、用户数据访问政策及实践培训等。
(5)劳动力发展和培养,包括数据基础设施劳动力的招聘、培训和流动等。
2. 对策建议
为推动数据基础设施总体设计、运营和性能提升,建议采取的措施包括:收集需求并确定参考用例,以推动数据基础设施互联互通框架的设计;确保规划中投入充足的成本,且有足够的替代方案,尽量考虑采用或者调整现有的方案,而不是开发新的解决方案;定期审查当前数据基础设施的性能;处理好数据基础设施互联互通的合作伙伴关系;全面评估支持数据和研究基础设施项目生命周期中各方面的劳动力需求。
信息来源:
https://www.whitehouse.gov/wp-content/uploads/2024/12/NSTC-Framework-For-Considering-Data-Infrastructure-and-Interconnectivity.pdf