AI在线 AI在线

ClaudeOpus4.1

​最新研究:大模型驱动的扫地机器人多任务表现不佳,成功率仅 40%

最近,AI 实验室 Andon Labs 进行的一项评估引发了广泛关注。 研究显示,搭载顶尖大模型的扫地机器人在执行简单家务任务时,其成功率仅为40%,远低于人类的表现。 此次实验要求机器人按照 “把黄油递给人” 的多步骤指令执行任务,涉及跨房间定位、识别包装、寻找移动位置的人类、完成交付并返回充电等复杂环节。
11/3/2025 8:51:16 AM
AI在线

Anthropic证实:Claude Opus 4.1和Opus 4模型出现 “降智” 现象,已紧急修复!

Anthropic 公司发布了一份事件报告,确认其最新的 Claude Opus4.1和 Opus4模型在8月25日至28日之间的确遭遇了 “降智” 现象。 用户们在使用这些模型时,可能会发现回答质量显著下降,包括回答不准确、格式错误,甚至在调用工具时出现问题。 据官方的说明,造成这一情况的原因是由于推理堆栈的更新引起的。
9/1/2025 2:26:08 PM
AI在线
  • 1