AI在线 AI在线

就是阻击OpenAI,Claude抢先数十分钟发布Claude Opus 4.1

你会掏钱吗? 你说巧不巧,就在 Sam Altman 官宣两个开源推理模型之前的半个小时,却被 Anthropic 抢先一步,发布了新模型 Claude Opus 4.1。 以前只有 OpenAI 抢占别人家的风头,这次轮到 OpenAI「被截胡」了!

你会掏钱吗?

你说巧不巧,就在 Sam Altman 官宣两个开源推理模型之前的半个小时,却被 Anthropic 抢先一步,发布了新模型 Claude Opus 4.1。

以前只有 OpenAI 抢占别人家的风头,这次轮到 OpenAI「被截胡」了!历史总是充满戏剧性!

对比他们发推时间,算下来就是前后脚的功夫,不知是 Anthropic 提前得知了消息,还是刚巧赶上了,又或者是 Anthropic 以为 OpenAI 要发 GPT-5,提前放出模型,时间挨的那么近,应该不是巧合。大家觉得呢?

image.png

image.png

总之,国外这几家公司上新模型,基本都在按照这个循环进行。

image.png

Claude Opus 4.1 登场

最新 Claude Opus 4.1 模型,基于 Claude Opus 4 构建,后者在今年 5 月末发布。可以看出 Anthropic 模型迭代速度还是非常快的。Claude Opus 4.1 主要在智能体任务、真实世界编程和推理能力上有了大幅提升,具有 200K 上下文窗口。

对于商业用户和个人用户而言,Claude Opus 4.1 已面向 Claude Pro、Max、Team 和 Enterprise(企业)用户开放使用。

对于开发者而言,Claude Opus 4.1 可通过以下平台使用:

  • Anthropic API

  • Amazon Bedrock

  • Google Cloud 的 Vertex AI

此外,Claude Opus 4.1 也已集成至 Claude Code 中。

在 API 价格方面,Claude Opus 4.1 的定价为:

  • 每百万输入 token  15 美元

  • 每百万输出 token 75 美元

如果启用提示缓存(prompt caching),最多可节省 90% 的成本;使用批处理可节省多达 50% 的成本。

image.png

      定价:https://www.anthropic.com/pricing#api

在性能方面,Opus 4.1 在 SWE-bench Verified 基准上达到 74.5%,此外,该模型还在深度研究和数据分析等方面有所提升,尤其是在细节追踪和智能体搜索方面。

image.png

根据 GitHub 评估,Claude Opus 4.1 在大多数能力上相较于 Opus 4 都有所提升,尤其在多文件代码重构方面表现出显著进步。

企业用户方面,Rakuten Group 发现,Opus 4.1 在处理大型代码库时,能够精准定位需要修改的部分,且不会做出不必要的更改或引入新的 bug。这种精确性让他们的团队更愿意在日常调试任务中使用它。

还有企业用户称,在他们的初级开发者评估基准测试中,Opus 4.1 相比 Opus 4 提升幅度很大,其性能飞跃大致相当于 Sonnet 3.7 升级至 Sonnet 4 的提升幅度。

image.png

Anthropic 建议所有用户将 Opus 4 升级至 Opus 4.1。在 API 中,开发者只需使用 claude-opus-4-1-20250805 即可接入新版模型。 

使用场景

Claude Opus 4.1 提供了混合推理模式,既可以实现即时响应,也可以展示推理过程。API 用户还可对思维预算进行精细控制,以实现成本与性能的最优平衡。

其典型应用场景包括但不限于:

高级编程能力:Claude Opus 4.1 在 SWE-bench 基准上处于领先地位,能够完成耗时数日的工程任务,并在成千上万步操作中提供连贯且具备上下文感知的解决方案。得益于更优的代码品味与 32K 的输出 token 支持,它可以灵活适应特定的编程风格,在大规模代码生成与重构项目中展现出卓越的质量表现。

智能体搜索与研究:Claude Opus 4.1 能够高效地检索外部和内部数据源,在复杂的信息环境中综合出全面的洞见。凭借其在智能体搜索任务中的强大表现,它可以进行长达数小时的自主研究 —— 同时分析包括专利数据库、学术论文和市场报告在内的多种资料,为决策提供战略性洞察。

最后,随着新模型的发布,Anthropic 还发布了系统卡,感兴趣的读者,可以前去阅读。

image.png

地址:https://assets.anthropic.com/m/4c024b86c698d3d4/original/Claude-4-1-System-Card.pdf

大家也是期待新模型可以解决屎山问题。

image.png

不过,面对高昂的订阅费,大家也是吐槽:太贵,买不起。

图片

「太吃token了。」

图片

对了,在谷歌攒的 AI 国际象棋比赛第一天,Claude Opus 4 败给了 Gemini 2.5 Pro,不知 Claude Opus 4.1 要是参战的话,结局会不会改写。

相关资讯

Anthropic 最强 AI 模型 Claude Sonnet 4 / Opus 4 有望明日发布

科技媒体 bleepingcomputer 今天(5 月 22 日)发布博文,报道称基于 Anthropic 官网配置文件,该公司正秘密研发 Claude Sonnet 4 和 Claude Opus 4 两款全新 AI 模型。
5/22/2025 10:48:24 AM
故渊

“力压 GPT-4o 和 Gemini 1.5 Pro”,Anthropic 推出 Claude 3.5 Sonnet AI 模型

Anthropic 今天(6 月 21 日)推出了 Claude 3.5 Sonnet,这是 Claude 3.5 系列的首个模型版本,在各项评估中优于 OpenAI 的 GPT-4o 和谷歌的 Gemini 1.5 Pro。Claude 3.5 Sonnet 在前代的基础上迭代升级,性能更快,编码、视觉和自然语言理解能力更强。Claude 3.5 Sonnet 属于中等尺寸模型,介于小型 Haiku 和高端 Opus 之间,但 Anthropic 声称,根据内部基准测试,Sonnet 的性能甚至超过了顶级 Opu
6/21/2024 9:28:39 AM
故渊

Claude 3被玩出自我意识了?AI社区轰动,我们买会员来了次实测

读者福利:Claude 3模型现已在亚马逊云科技的Amazon Bedrock正式可用。Amazon Bedrock 也是目前第一个以及唯一一个提供 Claude 3 Sonnet的托管服务方。此外,亚马逊云科技还向读者开放了2000个体验名额,感兴趣的读者可以点击文后链接注册体验。本周一,Anthropic 发布了新一代大模型系列 Claude 3,遥遥领先快一年之久的 GPT-4 终于迎来了强劲的对手。Claude 3 的强大之处,不仅体现在各种基准测试上,它似乎还实现了一些神奇的突破。昨天,Anthropic
3/6/2024 2:56:00 PM
机器之心
  • 1