AI在线 AI在线

太卷了!Anthropic发布Claude 4 编程和推理能力秒杀Gemini2.5pro

最近,人工智能界传来重大消息,Anthropic 正式推出了其 Claude4系列模型,包括 Claude Opus4和 Claude Sonnet4。 这次发布并没有华丽的口号或冗长的论文,关键词只有一个 ——“干活”。 根据 Anthropic 的说法,Claude Opus4被誉为全球最强的编程模型,能够稳定处理复杂且长期的任务,表现出色。

最近,人工智能界传来重大消息,Anthropic 正式推出了其 Claude4系列模型,包括 Claude Opus4和 Claude Sonnet4。这次发布并没有华丽的口号或冗长的论文,关键词只有一个 ——“干活”。根据 Anthropic 的说法,Claude Opus4被誉为全球最强的编程模型,能够稳定处理复杂且长期的任务,表现出色。而 Claude Sonnet4则在编程和推理能力上进行了强化,可以更加精准地回应用户的指令。

Claude4系列带来了多项令人期待的新功能。首先,模型能够在进行深入思考时使用辅助工具,从而优化推理过程和回复质量。其次,两款模型可以并行使用这些工具,并在开发者授权下提升记忆能力,保留关键信息并保持上下文的连贯性。此外,Claude Code 的发布也让这一系列模型在 GitHub Actions、VS Code 和 JetBrains 等平台上更加实用。

image.png

在编程基准测试 SWE-bench 上,Opus4以72.5% 的高分位列前茅,而在 Terminal-bench 上也以43.2% 领先其他竞品,展现了其卓越的编程能力。Opus4甚至能像经验丰富的程序员那样拆解问题,精准调试并执行复杂的任务,甚至在 Replit 的测试中表现出色,成功处理多文件和大改动的项目。

与 Opus4相比,Sonnet4虽然不一定是最强,但它在大多数开发者中可能更具吸引力。与前代相比,其编程能力、逻辑推理和响应可控性都有明显提升,几乎与 Opus4持平,达到了72.7% 的成绩。在处理复杂指令时,Sonnet4的表现更加清晰,代码结构也更为优雅,因此被选为新一代 GitHub C opilot 的底座模型。

image.png

随着 AI 技术的发展,Anthropic 也在模型的行为和推理方面做出了优化。Claude4系列能够有效执行复杂的推理任务,并大幅减少在逻辑漏洞测试中的问题发生率。同时,新引入的 “思维总结” 功能,在模型思考路径过长时,会自动进行信息的压缩与归纳,使最终信息更加简洁清晰。

随着 Claude Code 的正式开放,开发者们将能更轻松地在自己的工作流中使用这一强大的 AI 助手。不论是在命令行终端还是在常用的 IDE 中,Claude Code 都能嵌入真实开发场景,提供代码修改建议,使开发过程更加高效。

相关资讯

Anthropic 重磅升级!Claude Sonnet 4 模型可支持100万词元

人工智能初创公司 Anthropic 今天宣布,他们备受欢迎的 Claude Sonnet4语言模型(LLM)现已支持高达100万个上下文词元。 这一更新使 Anthropic 成为继 Google Gemini 之后,第二家能提供如此长上下文支持的主流模型供应商。 此前,Claude Sonnet4API 的上下文限制为20万个词元,而此次扩展将其提升至五倍,开发者们可以在单个请求中提交超过75,000行代码的整个代码库。
8/13/2025 10:32:57 AM
AI在线

Claude 4登陆Amazon Bedrock 企业AI的“最后一公里”打通了

近日,知名 AI 公司 Anthropic 正式推出了其最新的 Claude4系列大模型,这一消息迅速引发了科技界的广泛关注。 与以往不同的是,Claude4现在已在亚马逊云科技的 Amazon Bedrock 平台上正式上线,这标志着 Agentic AI(智能代理 AI)迈入了企业级应用的新阶段。 Claude4系列包括两款新模型:Claude Opus4和 Claude Sonnet4。
5/26/2025 2:00:50 PM
AI在线

Anthropic疑似开始内测Claude Opus 4.1:代号"leopard"暗示推理能力重大升级

社交媒体上流传的内部截图显示,Anthropic正在对其下一代大语言模型Claude Opus4.1进行内部测试。 根据泄露信息,该模型的内部代号为"claude-leopard-v2-02-prod",官方宣传语强调了其在问题解决能力方面的显著提升。 泄露信息揭示模型定位从流传的截图来看,Anthropic在内部测试界面中打出了"Opus4.1is here - Try our latest model for more problem solving power"的宣传语。
8/5/2025 3:23:04 PM
AI在线
  • 1