Meta 开源 LlamaFirewall,面向 AI 智能体的安全框架
2025 年 5 月 9 日
Meta 开源了 LlamaFirewall 安全框架,针对 AI 智能体在生产环境中面临的威胁提供系统级保护。该框架包含 PromptGuard 2、AlignmentCheck 和 CodeShield 三个模块,分别应对提示注入攻击、行为对齐问题和不安全代码生成。测试结果显示,LlamaFirewall 能显著降低攻击成功率,同时保持较高任务实用性。
体验专业版特色功能,拓展更丰富、更全面的相关内容。