AI在线 AI在线

窗口

上下文窗口错觉:为什么你的 128K token 不起作用

一、当理论容量遭遇现实困境在大语言模型(LLM)的技术竞赛中,上下文窗口长度早已成为各家标榜的核心指标。 从GPT-4o的128K到Gemini 1.5的1M,模型厂商不断突破Token容量的上限,仿佛更长的上下文就意味着更强的信息处理能力。 然而,这场“军备竞赛”背后却隐藏着一个残酷的现实:模型对长上下文的利用率远低于理论预期。
6/11/2025 4:25:00 AM
大模型之路

​Anthropic 即将发布 Claude 3.7,支持 50 万上下文窗口

Anthropic 公司计划推出新版本的 Claude3.7Sonnet,该版本将支持500,000个上下文窗口,相比当前的200,000个窗口大幅提升。 根据 TestingCatalog 的消息,这一扩展功能已经在功能标记中显现出来。 此次更新将使用户能够在提示中输入更大容量的内容。
3/27/2025 5:53:00 PM
AI在线

OpenAI史上最贵模型来了!比DeepSeek贵270倍,100万输出token 600美元

比DeepSeek-R1贵270倍,OpenAI史上最贵模型来了! 就在刚刚,OpenAI上线了推理模型o1-pro的API。 本来大家还挺高兴,结果一看到价格,悬着的心终于死了。
3/20/2025 11:58:29 AM

做时间序列预测有必要用深度学习吗?事实证明,梯度提升回归树媲美甚至超越多个DNN模型

在深度学习方法应用广泛的今天,所有领域是不是非它不可呢?其实未必,在时间序列预测任务上,简单的机器学习方法能够媲美甚至超越很多 DNN 模型。
3/6/2022 1:07:00 PM
机器之心
  • 1