AI在线 AI在线

Anthropic 重磅升级!Claude Sonnet 4 模型可支持100万词元

人工智能初创公司 Anthropic 今天宣布,他们备受欢迎的 Claude Sonnet4语言模型(LLM)现已支持高达100万个上下文词元。 这一更新使 Anthropic 成为继 Google Gemini 之后,第二家能提供如此长上下文支持的主流模型供应商。 此前,Claude Sonnet4API 的上下文限制为20万个词元,而此次扩展将其提升至五倍,开发者们可以在单个请求中提交超过75,000行代码的整个代码库。

人工智能初创公司 Anthropic 今天宣布,他们备受欢迎的 Claude Sonnet4语言模型(LLM)现已支持高达100万个上下文词元。这一更新使 Anthropic 成为继 Google Gemini 之后,第二家能提供如此长上下文支持的主流模型供应商。

此前,Claude Sonnet4API 的上下文限制为20万个词元,而此次扩展将其提升至五倍,开发者们可以在单个请求中提交超过75,000行代码的整个代码库。这一改变将极大地方便开发者,尤其是在需要处理复杂任务或大规模数据时。

Claude2,Anthropic,人工智能,聊天机器人 
 克劳德

现在,Claude Sonnet4的长上下文支持已在 Anthropic 的 API 和 Amazon Bedrock 上进入公开测试阶段,Google Cloud Vertex AI 也即将推出类似功能。不过,目前的长上下文支持仅向 Tier4级别的开发者开放,并设定了自定义的速率限制。Anthropic 表示,未来几周内将逐步向更多开发者开放这一功能。

随着上下文窗口的扩大,必然伴随更高的计算需求。Anthropic 为此推出了新的定价策略:对于20万个词元以下的提示,Sonnet4的费用为每百万输入词元3美元,每百万输出词元15美元。而对于超过20万个词元的提示,费用则提升为每百万输入词元6美元,输出词元22.5美元。值得注意的是,开发者可以通过使用快速缓存和批处理来有效降低成本,批处理甚至可以为1M 上下文窗口的定价提供50% 的折扣。

最近,在 Reddit 的一场问答会议上,OpenAI 的领导层讨论了支持长上下文窗口的计划。OpenAI 的首席执行官 Sam Altman 表示,尽管尚未发现用户对长上下文的强烈需求,但若有足够的兴趣,他们会考虑支持这一功能。OpenAI 团队的 Michelle Pokrass 提到,他们原本计划在 GPT-5中提供长达100万个词元的上下文支持,特别是针对 API 的用例,但由于 GPU 需求量大,未能如愿。

随着 Anthropic 推出1M 上下文的支持,其在长上下文功能方面直接与 Google Gemini 竞争,这无疑给 OpenAI 带来了重新评估其产品路线图的压力。

相关资讯

太卷了!Anthropic发布Claude 4 编程和推理能力秒杀Gemini2.5pro

最近,人工智能界传来重大消息,Anthropic 正式推出了其 Claude4系列模型,包括 Claude Opus4和 Claude Sonnet4。 这次发布并没有华丽的口号或冗长的论文,关键词只有一个 ——“干活”。 根据 Anthropic 的说法,Claude Opus4被誉为全球最强的编程模型,能够稳定处理复杂且长期的任务,表现出色。
5/23/2025 9:00:55 AM
AI在线

OpenAI o1 模型登场:开启 AI 通用复杂推理新篇章,国际奥数正确率 83%

感谢OpenAI 传闻中的“草莓”(Strawberry)AI 模型现已面世,正式名称为“o1”,是该公司首款具备“推理”能力的模型。o1 和 o1-miniOpenAI 表示对该模型进行特殊训练,能够比人类更快地回答更复杂的问题。与之同时发布的还有 o1-mini,一个更小、成本更低的版本。OpenAI 表示 o1 模型的发布,是其迈向类人 AI 宏伟目标的关键一步。AI在线注:o1 模型目前处于“预览”阶段,官方强调该模型相关开发尚处于初期阶段,相比较 GPT-4o 模型,使用成本更高且速度更慢,但在编写代码和
9/13/2024 6:56:28 AM
故渊

LLM词元:开发者实现AI高效开发的入门指南

译者 | 布加迪审校 | 重楼大语言模型(LLM)已彻底改变了机器理解和生成人类语言的方式,幕后支持从聊天机器人到内容生成器的各种应用。 其出色功能背后是每个开发人员都应该理解的一个基本概念:词元。 这个基本单元直接影响使用LLM时的模型性能和成本。
3/17/2025 8:00:00 AM
布加迪
  • 1