美情报高级研究计划局AI网络安全新计划聚焦LLM----中国科学院网信工作网

战略与政策

美情报高级研究计划局AI网络安全新计划聚焦LLM

日期：2025-05-26

| 来源：【字号：大中小】

据联邦新闻网2025年4月23日消息，美国情报高级研究计划局（IARPA）现有的AI网络安全项目“TrojAI”将于今年结束，下一代“TrojAI”项目将主要关注大语言模型领域，重点包括识别训练数据偏差引发的安全漏洞、防范提示词攻击导致的机密泄露、抑制模型幻觉等领域。

TrojAI是IARPA于2019年启动的一个项目，旨在开发相关软件，以快速且准确地检测已部署AI系统所遭受的恶意攻击（即特洛伊木马攻击），从而保护AI系统免受此类攻击。该项目的研究重点涵盖图像分类、强化学习和自然语言处理等多个领域。

信息来源：

https://federalnewsnetwork.com/artificial-intelligence/2025/04/iarpa-looks-to-next-round-of-ai-cybersecurity-research/

https://mail.executivegov.com/2025/04/rick-muller-iarpa-large-language-models-ai-cyber-research/