AI在线 AI在线

ClaudeOpus4.5

​耐力惊人!Anthropic 旗舰模型 Claude Opus4.5创下“长任务”处理新纪录

​耐力惊人!Anthropic 旗舰模型 Claude Opus4.5创下“长任务”处理新纪录

在追求大模型“高智商”的同时,AI 的持续执行能力正成为衡量其进化水平的新维度。 根据人工智能研究机构METR发布的最新基准测试,Anthropic 旗下的顶级模型Claude Opus4.5在处理超长时间任务方面展现出了统治级实力。 测试结果显示,Claude Opus4.5在维持50% 成功率的前提下,能够持续处理长达约 4小时49分钟 的复杂任务,这一表现刷新了行业历史记录。
12/22/2025 12:21:31 PM AI在线
Claude Opus 4.5 正式上线亚马逊 Bedrock,提升 AI 模型性能

Claude Opus 4.5 正式上线亚马逊 Bedrock,提升 AI 模型性能

在人工智能领域,Anthropic 推出了最新的基础模型 ——Claude Opus4.5,该模型现已在亚马逊 Bedrock 平台上提供。 亚马逊 Bedrock 是一项完全托管的服务,允许用户选择来自领先 AI 公司的高性能基础模型。 Claude Opus4.5的发布标志着 AI 系统能力的一次重大提升,尤其在编码、智能代理、计算机使用及办公任务方面,其性能优于 Sonnet4.5和 Opus4.1,且成本仅为 Opus 系列的三分之一。
11/25/2025 9:56:30 AM AI在线
Claude Opus4.5 或今日重磅发布,对标 GPT-5.1 和 Gemini Pro

Claude Opus4.5 或今日重磅发布,对标 GPT-5.1 和 Gemini Pro

AI基准平台Epoch AI页面短暂出现代号“Claude Kayak”的新模型条目,标注发布时间正是今日,随即被删除,引发全球AI社区高度关注。 业内普遍认为,“Claude Kayak”即Anthropic即将推出的旗舰模型Claude Opus4.5。 作为Claude4系列最强版本,Opus4.5预计在复杂推理、多步代理任务及代码生成能力上实现大幅跃升,有望在SWE-bench Verified等权威评测中突破80%得分,直接对标OpenAI GPT-5.1与Google Gemini3.0Pro。
11/24/2025 4:02:15 PM AI在线