AI在线 AI在线

​Anthropic 推出新方法,让 Claude 避免 “政治偏见” 标签

近日,Anthropic 公司发布了一种新的方法,用于评估其聊天机器人 Claude 在政治问题上的响应是否公正中立。 该公司表示,Claude 在回答政治相关问题时应避免没有证据的政治主张,旨在防止其被视为偏向保守或自由派。 Claude 的表现受系统提示和奖励机制的影响,特别是奖励那些被认为是中立的回答。

近日,Anthropic 公司发布了一种新的方法,用于评估其聊天机器人 Claude 在政治问题上的响应是否公正中立。该公司表示,Claude 在回答政治相关问题时应避免没有证据的政治主张,旨在防止其被视为偏向保守或自由派。

Claude 的表现受系统提示和奖励机制的影响,特别是奖励那些被认为是中立的回答。这些中立回答中可能包含有关尊重 “传统价值观和制度重要性” 的内容,显示出该公司试图让 Claude 更符合美国当前的政治需求。

Anthropic、克劳德

根据报告,Gemini2.5Pro 被评为最中立的 AI,得分高达97%,而 Claude Opus4.1则以95% 的得分紧随其后。其他模型如 Sonnet4.5、GPT-5、Grok4和 Llama4的评分也相对较高,但仍低于 Claude。尽管 Anthropic 在其博客中未明确提到,但这一测试方法的推出很可能与特朗普政府的政策有关,该政策要求聊天机器人不得展现 “觉醒”(woke)现象。同时,OpenAI 也在将其 GPT-5模型调整至相似的方向,以满足美国政府的要求。

值得一提的是,Anthropic 将其测试方法以开源的形式发布在 GitHub 上,方便其他开发者和研究人员使用和评估。

划重点:  

🌐 Anthropic 推出新方法,评估 Claude 在政治问题上的中立性。  

🤖 Claude 避免没有证据的政治主张,旨在消除偏见标签。  

📈 该测试方法开源发布,促进 AI 开发者间的交流与合作。

相关资讯

谷歌推出更新版 Gemini 2.5 Pro,AI 性能大幅提升

谷歌最近在其 AI 模型系列中迎来了重要更新。 继今年3月底推出 Gemini2.5Pro 模型后,谷歌紧接着在4月发布了更为轻量的 Gemini2.5Flash 版本。 虽然两者目前都处于预览阶段,但 Gemini2.5Flash 版本已经通过 Gemini App 向全球用户开放,用户可以体验其强大的功能。
6/6/2025 9:00:55 AM
AI在线

​谷歌发布Gemini2.5Pro预览版:编码性能击败DeepSeek R1和Grok 3 Beta

谷歌近日推出了其最新的 Gemini2.5Pro 预览版,这款被誉为 “最智能” 模型的产品,首次在3月份宣布,随后在5月份进行了升级。 此次发布的预览版旨在为企业提供一个测试新应用程序或替换早期版本的机会。 根据谷歌的官方博客,这一新版本在回应速度和创意上表现更佳,同时在编码和推理能力上超越了其他模型。
6/6/2025 10:01:06 AM
AI在线

Google 不慎泄露 Gemini CLI 开源即将推出文章,现已404

近日,Google 意外发布了一篇关于 Gemini CLI 的博客文章,但目前该页面已返回404错误。 这篇未正式公开的文章披露了 Gemini CLI 的多项关键功能,引发开发者社区热议。 文章内容显示,Gemini CLI 是一款面向 Gemini2.5Pro 的开源命令行界面(CLI)工具,支持高达100万代币的上下文窗口,适合处理复杂代码和大规模数据。
6/25/2025 3:00:44 PM
AI在线