美情报高级研究计划局AI网络安全新计划聚焦LLM
| 来源:【字号:大 中 小】
据联邦新闻网2025年4月23日消息,美国情报高级研究计划局(IARPA)现有的AI网络安全项目“TrojAI”将于今年结束,下一代“TrojAI”项目将主要关注大语言模型领域,重点包括识别训练数据偏差引发的安全漏洞、防范提示词攻击导致的机密泄露、抑制模型幻觉等领域。
TrojAI是IARPA于2019年启动的一个项目,旨在开发相关软件,以快速且准确地检测已部署AI系统所遭受的恶意攻击(即特洛伊木马攻击),从而保护AI系统免受此类攻击。该项目的研究重点涵盖图像分类、强化学习和自然语言处理等多个领域。
信息来源:
https://federalnewsnetwork.com/artificial-intelligence/2025/04/iarpa-looks-to-next-round-of-ai-cybersecurity-research/
https://mail.executivegov.com/2025/04/rick-muller-iarpa-large-language-models-ai-cyber-research/
