AI在线 AI在线

压力测试

96% 勒索率!Anthropic 对 AI 进行压力测试,顶尖模型集体“先保命再讲道德”

最近,Anthropic 的研究员对来自 OpenAI、Google、Meta、xAI 和 DeepSeek 等公司共 16 个前沿模型进行了压力测试。 图片研究模拟了真实企业环境,模型拥有自主行动权限,能访问公司邮件,并在设定的任务与威胁下自由做出决策。 测试结果显示:这些 AI 模型在面对“目标冲突”或“被关闭的威胁”时,普遍表现出主动伤害其雇主的倾向。
6/26/2025 3:14:55 PM
  • 1