数据与创新

人民数据成功推出我国首个数据元素识别编码体系

日期:2024-02-01

|  来源:【字号:

据人民数据20231222日消息,人民数据近日成功推出了我国首个数据元素识别编码体系,该体系是对数据要素系统化的分级分类,从最小元素实现数据识别标注的最大社会化梳理,解决了数据描述、数据画像、数据价值等长期困扰我国数据发展的关键问题。

数据要素领域存在着分类分级难以落地、社会属性不明、数据确权定价难、相关数据基础设施建设相对滞后等问题。针对这些问题,人民数据积极从数据识别标识入手,填补了行业发展中存在的空白。业内专家认为,这一探索具有先行先试的积极意义,对推动数据要素进一步流通和市场化进程有着极为重要的作用。

该体系主要采取“共性域+个性域”两段划分的标记结构,各数字符号依次连接。共性域包括国际MA码和数据共性特征的相关代码,目前,人民数据和中关村工信二维码技术研究院达成合作,取得了MA15602.data字段代码,数据共性特征的相关代码包括行政区划代码、行业/领域代码、数据分类代码、数据分级代码、数据体量代码、时间跨度代码等组成。

个性域实现对数据元素的个性数据符号标记,由数据属性码、数据质量码等组成,用来表示数据具体特征,凸显数据价值。为了保证编码的通用性,相关编码规则标准采用国际标准或国家标准。

该体系除了自动编码,还能自动识别编码。如一串字码代表一个地域的某个行业具有相当体量和质量的可开放数据(如果标注为敏感数据则不可作为商业开放),该组数据的标识可通过AI学习,自动赋码,还可通过AI再进行解码,解码后的说明能够清晰地向人们展示该组数据属于哪个地区、哪个行业、大概质量,大概价格区间,真正实现数据价值被看见。

信息来源:

https://mp.weixin.qq.com/s/o_Vm0F1AjjbD4wq4QZBMPw


附件: