Meta 开源 LlamaFirewall，面向 AI 智能体的安全框架

2025 年 5 月 9 日

Meta 开源了 LlamaFirewall 安全框架，针对 AI 智能体在生产环境中面临的威胁提供系统级保护。该框架包含 PromptGuard 2、AlignmentCheck 和 CodeShield 三个模块，分别应对提示注入攻击、行为对齐问题和不安全代码生成。测试结果显示，LlamaFirewall 能显著降低攻击成功率，同时保持较高任务实用性。