战略与政策

美情报高级研究计划局AI网络安全新计划聚焦LLM

日期:2025-05-26

|  来源:【字号:

据联邦新闻网2025423日消息,美国情报高级研究计划局(IARPA)现有的AI网络安全项目“TrojAI”将于今年结束,下一代“TrojAI”项目将主要关注大语言模型领域,重点包括识别训练数据偏差引发的安全漏洞、防范提示词攻击导致的机密泄露、抑制模型幻觉等领域。

TrojAIIARPA2019年启动的一个项目,旨在开发相关软件,以快速且准确地检测已部署AI系统所遭受的恶意攻击(即特洛伊木马攻击),从而保护AI系统免受此类攻击。该项目的研究重点涵盖图像分类、强化学习和自然语言处理等多个领域。

信息来源:

https://federalnewsnetwork.com/artificial-intelligence/2025/04/iarpa-looks-to-next-round-of-ai-cybersecurity-research/

https://mail.executivegov.com/2025/04/rick-muller-iarpa-large-language-models-ai-cyber-research/


附件: