AI在线 AI在线

Operational Safety

南洋理工揭露AI「运行安全」的全线崩溃,简单伪装即可骗过所有模型

本文的第一作者雷京迪是南洋理工大学博士生,其研究聚焦于大语言模型,尤其关注模型推理、后训练与对齐等方向。 通讯作者 Soujanya Poria 为南洋理工大学电气与电子工程学院副教授。 论文的其他合作者来自 Walled AI Labs、新加坡资讯通信媒体发展局 (IMDA) 以及 Lambda Labs。
10/17/2025 1:34:00 PM
机器之心
  • 1