Claude Opus4.5 或今日重磅发布，对标 GPT-5.1 和 Gemini Pro

作者：AI在线 2025-11-24 04:02

AI基准平台Epoch AI页面短暂出现代号“Claude Kayak”的新模型条目，标注发布时间正是今日，随即被删除，引发全球AI社区高度关注。业内普遍认为，“Claude Kayak”即Anthropic即将推出的旗舰模型Claude Opus4.5。作为Claude4系列最强版本，Opus4.5预计在复杂推理、多步代理任务及代码生成能力上实现大幅跃升，有望在SWE-bench Verified等权威评测中突破80%得分，直接对标OpenAI GPT-5.1与Google Gemini3.0Pro。

AI基准平台Epoch AI页面短暂出现代号“Claude Kayak”的新模型条目，标注发布时间正是今日，随即被删除，引发全球AI社区高度关注。

业内普遍认为，“Claude Kayak”即Anthropic即将推出的旗舰模型Claude Opus4.5。作为Claude4系列最强版本，Opus4.5预计在复杂推理、多步代理任务及代码生成能力上实现大幅跃升，有望在SWE-bench Verified等权威评测中突破80%得分，直接对标OpenAI GPT-5.1与Google Gemini3.0Pro。

Claude2，Anthropic，人工智能，聊天机器人
克劳德

继今年8月Opus4.1发布后，Anthropic已陆续推出Sonnet4.5与Haiku4.5，此次Opus4.5若如期亮相，将完成Claude4全系列更新，进一步巩固其在多模态与企业级AI领域的领先地位。

截至发稿，Anthropic官方尚未回应，但社区已进入“待机”状态。开发者普遍期待新模型带来更强代理协调能力和更长上下文处理能力，同时担忧高算力需求可能延续Opus系列“限量供应”传统。若今日确认发布，Claude Opus4.5将成为2025年岁末AI竞赛中最重磅的事件之一。

Anthropic证实：Claude Opus 4.1和Opus 4模型出现 “降智” 现象，已紧急修复！

Anthropic 公司发布了一份事件报告，确认其最新的 Claude Opus4.1和 Opus4模型在8月25日至28日之间的确遭遇了 “降智” 现象。用户们在使用这些模型时，可能会发现回答质量显著下降，包括回答不准确、格式错误，甚至在调用工具时出现问题。据官方的说明，造成这一情况的原因是由于推理堆栈的更新引起的。

9/1/2025 2:26:08 PM AI在线

Claude Opus 4.5 正式上线亚马逊 Bedrock，提升 AI 模型性能

在人工智能领域，Anthropic 推出了最新的基础模型 ——Claude Opus4.5，该模型现已在亚马逊 Bedrock 平台上提供。亚马逊 Bedrock 是一项完全托管的服务，允许用户选择来自领先 AI 公司的高性能基础模型。 Claude Opus4.5的发布标志着 AI 系统能力的一次重大提升，尤其在编码、智能代理、计算机使用及办公任务方面，其性能优于 Sonnet4.5和 Opus4.1，且成本仅为 Opus 系列的三分之一。

11/25/2025 9:56:30 AM AI在线

最新研究：大模型驱动的扫地机器人多任务表现不佳，成功率仅 40%

最近，AI 实验室 Andon Labs 进行的一项评估引发了广泛关注。研究显示，搭载顶尖大模型的扫地机器人在执行简单家务任务时，其成功率仅为40%，远低于人类的表现。此次实验要求机器人按照 “把黄油递给人” 的多步骤指令执行任务，涉及跨房间定位、识别包装、寻找移动位置的人类、完成交付并返回充电等复杂环节。

11/3/2025 8:51:16 AM AI在线

Claude Opus4.5 或今日重磅发布，对标 GPT-5.1 和 Gemini Pro

相关资讯

Anthropic证实：Claude Opus 4.1和Opus 4模型出现 “降智” 现象，已紧急修复！

Claude Opus 4.5 正式上线亚马逊 Bedrock，提升 AI 模型性能

​最新研究：大模型驱动的扫地机器人多任务表现不佳，成功率仅 40%

最新研究：大模型驱动的扫地机器人多任务表现不佳，成功率仅 40%