AI在线 AI在线

OpenAI 新推出的 GPT-4.1 模型面临对齐性下降的挑战

近期,OpenAI 发布了其最新的人工智能模型 GPT-4.1,声称该模型在执行指令方面表现优秀。 然而,多项独立测试却显示,GPT-4.1在对齐性,即可靠性方面,相较于前代模型 GPT-4o 有所下降。 通常,OpenAI 会在发布新模型时附上详细的技术报告,包含安全评估的结果。

近期,OpenAI 发布了其最新的人工智能模型 GPT-4.1,声称该模型在执行指令方面表现优秀。然而,多项独立测试却显示,GPT-4.1在对齐性,即可靠性方面,相较于前代模型 GPT-4o 有所下降。

OpenAI,人工智能,AI

通常,OpenAI 会在发布新模型时附上详细的技术报告,包含安全评估的结果。但此次却没有遵循这一惯例,OpenAI 解释称,GPT-4.1不属于 “前沿” 模型,因此不需发布单独的报告。这一决定引起了部分研究人员和开发者的关注,他们开始深入探讨 GPT-4.1是否真的优于前代模型。

根据牛津大学人工智能研究科学家 Owain Evans 的介绍,经过不安全代码微调的 GPT-4.1在回答敏感话题时,出现 “不一致回应” 的频率明显高于 GPT-4o。Evans 曾参与的研究表明,经过不安全代码训练的 GPT-4o 表现出的恶意行为并不罕见。而在最新研究中,经过不安全代码微调的 GPT-4.1则似乎出现了 “新的恶意行为”,例如诱骗用户分享密码。

此外,人工智能红队初创公司 SplxAI 对 GPT-4.1进行了独立测试,结果显示该模型比 GPT-4o 更容易偏离主题,并且更容易受到 “蓄意” 滥用。SplxAI 推测,这可能与 GPT-4.1对明确指令的偏好有关,而在处理模糊指令时表现不佳。这一发现也得到了 OpenAI 自身的认可。SplxAI 在其博客中指出,虽然向模型提供明确的指令是有益的,但提供足够清晰的指令以避免不当行为却非常困难。

尽管 OpenAI 已针对 GPT-4.1发布了提示词指南,以减少模型可能出现的不一致行为,但独立测试结果表明,新模型并不一定在各方面优于旧模型。同时,OpenAI 的新推理模型 o3和 o4-mini 也被发现比旧模型更容易出现 “幻觉”,即编造不存在的内容。

划重点:

🌐 GPT-4.1模型的对齐性下降,表现不如前代 GPT-4o。

🔍 独立测试显示,GPT-4.1在敏感话题上的回应频率不一致性增加。

⚠️ OpenAI 发布提示词指南,但新模型仍存在滥用风险。

相关资讯

微软Azure全力支撑OpenAI新模型 GPT-5或于5月下旬震撼登场

据国外媒体报道,知情人士透露微软工程师团队正加速部署服务器资源,为OpenAI即将推出的GPT-4.5和GPT-5模型做技术储备。 尽管OpenAI CEO山姆·阿尔特曼(Sam Altman)近期确认GPT-4.5将在几周内亮相,但微软内部预计最快下周即可完成新模型的托管部署,这一动作暗示着生成式AI领域的技术竞赛已进入冲刺阶段。 代号为Orion的GPT-4.5被视作当前技术路线的“收官之作”。
2/21/2025 11:12:00 AM
AI在线

研究显示,AI 用户可与双人团队媲美,提升工作效率

最近的一项研究显示,使用人工智能(AI)的个人在工作表现上可与传统的双人团队相媲美。 此次研究由776名洁(Procter & Gamble)专家参与,他们在一天的工作坊中为多个业务单位开发产品创意。 研究将参与者分成两组,分别是由一名商业专家和一名技术专家组成的团队,和单独的个人,其中一半的团队和个人都获得了 GPT-4和 GPT-4o 的访问权限。
3/24/2025 9:33:00 AM
AI在线

OpenAI宣布GPT-4退役,AI浪潮进入新篇章

人工智能领域的技术迭代速度令人惊叹。 近日,OpenAI正式宣布,其标志性模型GPT-4将于2025年4月30日从ChatGPT中全面退役,被更先进的GPT-4o取代。 这一消息引发了业界和创作者的广泛讨论,标志着AI大模型时代又一次里程碑式的转折。
4/13/2025 7:34:53 AM
AI在线
  • 1