美国家安全局联合多方发布AI数据保护实践指南
| 来源:【字号:大 中 小】
2025年5月22日,美国国家安全局(NSA)联合网络安全与基础设施安全局(CISA)、联邦调查局(FBI)以及英国、澳大利亚、新西兰等国的网络安全机构,共同发布了《AI数据安全:保护用于训练和运行AI系统的数据的最佳实践指南》,旨在为AI系统的数据安全提供最佳实践和建议。
该指南聚焦AI系统训练和运行过程中的数据安全问题,确定了三大核心目标:一是提高对AI系统在开发、测试以及部署全生命周期数据安全风险的意识。二是为每个阶段提供实用的AI数据保护最佳实践,并深入分析关键风险领域。三是鼓励采用强有力的数据保护措施,主动实施风险缓解策略,为AI系统构建安全且具韧性的基础。
1. 关键风险领域
指南特别强调了如下三个关键风险领域:
(1)数据供应链风险
数据供应链风险是指在数据从收集到最终使用的整个流程中可能面临的各种安全隐患。如果数据来源不可靠,或在流转过程中缺乏有效的追踪机制,加之多级供应商可能引入安全漏洞,这些环节都极易成为攻击者利用的薄弱点。为有效缓解这些风险,相关组织应采取以下具体措施:建立可信的数据来源验证机制;采用加密签名验证数据的完整性;对供应链各个环节的安全进行全面评估。
(2)恶意篡改数据风险
恶意篡改风险是指攻击者故意在AI训练数据中加入不精确或具有误导性的信息,目的是破坏系统的性能或操纵输出结果。为有效缓解这些风险,相关组织应采取以下具体措施:建立严格的数据清洗和验证流程;构建异常检测机制,以识别可疑数据;创建“干净数据”,从源头上保障数据的安全性和可靠性。
(3)数据漂移风险
数据漂移风险是指在模型运行过程中,随着时间推移,运行环境中的数据分布与原始训练数据之间出现显著差异,从而可能导致模型性能下降的风险。为有效缓解这类风险,相关组织应建立持续的监控机制,实时检测数据分布的变化情况,并定期使用新数据对模型进行重新训练。
2. 最佳实践方法
指南提出了十条最佳实践方法:(1)确保数据来源的可靠性并追踪数据流向;(2)运用校验与加密哈希技术,保障数据在存储和传输过程中的完整性;(3)利用数字签名验证数据修订的可信度;(4)构建可信的基础设施,为数据处理提供安全隔离区域,保护敏感信息免受篡改;(5)对数据进行分类保护,并实施相应的安全控制措施,如加密和访问控制;(6)对数据进行加密保护;(7)确保数据存储的安全;(8)利用隐私保护技术减少敏感信息的泄漏风险;(9)采用加密删除、块删除或数据覆盖等安全删除方法彻底清除数据,确保数据无法恢复;(10)持续评估数据安全风险,不断改进安全措施,以应对安全威胁的变化。
信息来源:
https://www.cisa.gov/news-events/alerts/2025/05/22/new-best-practices-guide-securing-ai-data-released
https://media.defense.gov/2025/May/22/2003720601/-1/-1/0/CSI_AI_DATA_SECURITY.PDF
https://mp.weixin.qq.com/s/refwVwrPLbcHDKY8VSOtNQ
