国家数据局发布高质量数据集建设方案 为AI打造“数据燃料”
| 来源:【字号:大 中 小】
2026年4月15日,国家数据局发布《关于推进行业高质量数据集建设行动的实施方案(征求意见稿)》(以下简称《方案》),紧扣“人工智能+”行动,旨在构建“场景牵引建设、数据驱动模型、模型赋能产业、应用催生新需求”的闭环“数据飞轮”,使数据与AI形成良性循环。
《方案》提出,到2028年底,建成一批覆盖重点领域、经过应用验证的行业高质量数据集,打造一批数据驱动人工智能创新发展的典型应用场景,培育一批具备领先优势的创新型数据企业和专业人才,形成一批行业高质量数据集建设标准和工具。
《方案》明确,面向人工智能预训练、强化学习等阶段,持续推进文本、图像、音频、视频等多模态高质量数据集建设。面向智能体等新型智能应用形态,加强知识库、知识图谱、本体等数据集建设。面向具身智能发展需求,加快重点场景物理交互、环境感知、运动控制等真机交互数据集建设。积极布局世界模型等前沿方向数据集建设。
在创新行业高质量数据集商业模式方面,《方案》提出,推动商业模式从基础数据包销售向应用程序接口(API)调用、模型化解决方案及全栈服务梯次跃升。探索词元交易等新型数据集交易模式,构建以词元为基础,可量化、可定价的数据集价值体系。
信息来源:
https://www.nda.gov.cn/sjj/hdjl/yjzq/yjzqform/list/index_pc.html?code=ff808081-9b5b91e0-019d-9170882a-3b0f
https://www.news.cn/tech/20260417/825c7ff35a4f4e6a81deb82e53e15a56/c.html
https://mp.weixin.qq.com/s/p-miF_uvQYEa1Fex1j5U1g
