AI在线 AI在线

Meta-SecAlign

AI安全上,开源仍胜闭源,Meta、UCB防御LLM提示词注入攻击

Meta 和 UCB 开源首个工业级能力的安全大语言模型 Meta-SecAlign-70B,其对提示词注入攻击(prompt injection)的鲁棒性,超过了 SOTA 的闭源解决方案(gpt-4o, gemini-2.5-flash),同时拥有更好的 agentic ability(tool-calling,web-navigation)。 第一作者陈思哲是 UC Berkeley 计算机系博士生(导师 David Wagner),Meta FAIR 访问研究员(导师郭川),研究兴趣为真实场景下的 AI 安全。 共同技术 lead 郭川是 Meta FAIR 研究科学家,研究兴趣为 AI 安全和隐私。
7/30/2025 10:14:00 AM
机器之心
  • 1