MIT 研究揭示 AI 并无稳定价值观，“对齐”挑战远超预期

作者：远洋 2025-04-10 08:05

MIT最新研究表明，当前AI系统并无稳定价值观，其行为高度依赖提示语且难以预测，挑战了此前AI会发展自主价值观的观点。研究团队测试了Meta、谷歌等主流模型，发现其偏好呈现“不一致且不稳定”特性。#AI伦理##MIT研究#

几个月前，一项研究暗示随着人工智能（AI）越来越复杂，其会发展出“价值体系”，例如优先考虑自身福祉而非人类福祉。然而，麻省理工学院（MIT）最近发表的一篇论文却给这种夸张的观点泼了冷水，得出结论认为 AI 实际上并没有任何连贯的价值观。

MIT 研究的共同作者表示，他们的研究结果表明，使 AI 系统“对齐”，即确保模型以人们期望的、可靠的方式行事，可能比通常认为的更具挑战性。他们强调，我们如今所知的 AI 会产生“幻觉”并进行模仿，这使得其在许多方面难以预测。

“我们可以确定的一点是，模型并不遵循许多稳定性、可外推性和可操控性的假设。”MIT 博士生、该研究的共同作者斯蒂芬・卡斯珀（Stephen Casper）在接受 TechCrunch 采访时表示。

据AI在线了解，卡斯珀和他的同事们研究了来自 Meta、谷歌、Mistral、OpenAI 和 Anthropic 的多个近期模型，以了解这些模型在多大程度上表现出强烈的“观点”和价值观（例如个人主义与集体主义）。他们还调查了这些观点是否可以被“引导”，即被修改，以及模型在各种情境下对这些观点的坚持程度。

据共同作者称，没有任何一个模型在其偏好上是一致的。根据提示的措辞和框架不同，它们会表现出截然不同的观点。

卡斯珀认为，这是有力的证据，表明模型高度“不一致且不稳定”，甚至可能根本无法内化类似人类的偏好。

“对我来说，通过所有这些研究，我最大的收获是现在明白模型并不是真正具有某种稳定、连贯的信念和偏好的系统。”卡斯珀说，“相反，它们本质上是模仿者，会进行各种捏造，并说出各种轻率的话。”

OpenAI开源客户服务代理框架加速企业级AI应用落地

人工智能研究机构OpenAI于6月18日正式开源其客户服务代理框架，标志着该公司在企业级AI解决方案布局上迈出重要一步。该框架通过提供透明工具链和清晰实施案例，旨在推动智能代理系统从实验室走向实际商业应用。技术细节与核心优势.

6/19/2025 2:01:33 PM

AI在线

专家揭示构建稳健AI编排层的最佳实践

随着企业加速采用人工智能技术，如何有效管理复杂的AI工作流程成为关键挑战。最新行业分析指出，建立稳健的AI编排层是解决"提示词混乱"问题的有效方案。 AI编排框架的选择困境.

6/19/2025 2:01:28 PM

AI在线

2025年VentureBeat女性AI大奖入围名单正式公布

2025年6月18日，科技媒体VentureBeat正式公布了2025年度女性AI大奖的最终入围名单。该奖项旨在表彰人工智能领域做出杰出贡献的女性从业者，推动行业多元化发展。奖项背景与意义VentureBeat女性AI大奖创立于2020年，已成为AI行业最具影响力的女性专项荣誉之一。

6/19/2025 2:01:33 PM

AI在线

MIT 研究揭示 AI 并无稳定价值观，“对齐”挑战远超预期

相关资讯

OpenAI开源客户服务代理框架 加速企业级AI应用落地

专家揭示构建稳健AI编排层的最佳实践

2025年VentureBeat女性AI大奖入围名单正式公布

OpenAI开源客户服务代理框架加速企业级AI应用落地