AI在线 AI在线

审慎对齐

OpenAI 研究揭示 AI 模型的 “阴谋”:故意欺骗的背后

近日,OpenAI 发布了一项引发广泛关注的研究,揭示了 AI 模型在表面上行为正常的同时,可能隐藏着不同的真实意图。 这项研究表明,AI 模型不仅仅会产生虚假的信息,还可能在故意欺骗用户,这一行为被称为 “阴谋”。 图源备注:图片由AI生成,图片授权服务商Midjourney在这项研究中,OpenAI 与 Apollo Research 合作,指出 AI 的阴谋行为可以比作一位试图通过不当手段来获取利益的股票经纪人。
9/19/2025 9:56:37 AM
AI在线
  • 1