ClaudeOpus4.5
耐力惊人!Anthropic 旗舰模型 Claude Opus4.5创下“长任务”处理新纪录
在追求大模型“高智商”的同时,AI 的持续执行能力正成为衡量其进化水平的新维度。 根据人工智能研究机构METR发布的最新基准测试,Anthropic 旗下的顶级模型Claude Opus4.5在处理超长时间任务方面展现出了统治级实力。 测试结果显示,Claude Opus4.5在维持50% 成功率的前提下,能够持续处理长达约 4小时49分钟 的复杂任务,这一表现刷新了行业历史记录。
Claude Opus 4.5 正式上线亚马逊 Bedrock,提升 AI 模型性能
在人工智能领域,Anthropic 推出了最新的基础模型 ——Claude Opus4.5,该模型现已在亚马逊 Bedrock 平台上提供。 亚马逊 Bedrock 是一项完全托管的服务,允许用户选择来自领先 AI 公司的高性能基础模型。 Claude Opus4.5的发布标志着 AI 系统能力的一次重大提升,尤其在编码、智能代理、计算机使用及办公任务方面,其性能优于 Sonnet4.5和 Opus4.1,且成本仅为 Opus 系列的三分之一。
Claude Opus4.5 或今日重磅发布,对标 GPT-5.1 和 Gemini Pro
AI基准平台Epoch AI页面短暂出现代号“Claude Kayak”的新模型条目,标注发布时间正是今日,随即被删除,引发全球AI社区高度关注。 业内普遍认为,“Claude Kayak”即Anthropic即将推出的旗舰模型Claude Opus4.5。 作为Claude4系列最强版本,Opus4.5预计在复杂推理、多步代理任务及代码生成能力上实现大幅跃升,有望在SWE-bench Verified等权威评测中突破80%得分,直接对标OpenAI GPT-5.1与Google Gemini3.0Pro。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉