窗口
上下文窗口错觉:为什么你的 128K token 不起作用
一、当理论容量遭遇现实困境在大语言模型(LLM)的技术竞赛中,上下文窗口长度早已成为各家标榜的核心指标。 从GPT-4o的128K到Gemini 1.5的1M,模型厂商不断突破Token容量的上限,仿佛更长的上下文就意味着更强的信息处理能力。 然而,这场“军备竞赛”背后却隐藏着一个残酷的现实:模型对长上下文的利用率远低于理论预期。
6/11/2025 4:25:00 AM
大模型之路
Anthropic 即将发布 Claude 3.7,支持 50 万上下文窗口
Anthropic 公司计划推出新版本的 Claude3.7Sonnet,该版本将支持500,000个上下文窗口,相比当前的200,000个窗口大幅提升。 根据 TestingCatalog 的消息,这一扩展功能已经在功能标记中显现出来。 此次更新将使用户能够在提示中输入更大容量的内容。
3/27/2025 5:53:00 PM
AI在线
OpenAI史上最贵模型来了!比DeepSeek贵270倍,100万输出token 600美元
比DeepSeek-R1贵270倍,OpenAI史上最贵模型来了! 就在刚刚,OpenAI上线了推理模型o1-pro的API。 本来大家还挺高兴,结果一看到价格,悬着的心终于死了。
3/20/2025 11:58:29 AM
做时间序列预测有必要用深度学习吗?事实证明,梯度提升回归树媲美甚至超越多个DNN模型
在深度学习方法应用广泛的今天,所有领域是不是非它不可呢?其实未必,在时间序列预测任务上,简单的机器学习方法能够媲美甚至超越很多 DNN 模型。
3/6/2022 1:07:00 PM
机器之心
- 1
资讯热榜
阿里推出 AI 医学助手 App“氢离子”:收录千万级核心期刊文献,还可查疾病、找药品
Lovart 实战深度测评!仅需4小时帮你完成一整套品牌全案设计!
性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源
Meta 被指控盗用 2000 余部成人影片训练 AI,或面临 3.5 亿美元天价赔偿
刷新无监督异常检测上限!首提「匹配代价滤波for异常检测」范式 | ICML'25
OpenAI 董事会主席:如果你想快速烧掉百万美元,就开发自己的 AI 模型吧
AI和云基础设施初创企业E2B如何成为88%的财富100强企业的必备选择
行业首个 100% 开源的企业级智能体,京东云开源 JoyAgent
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用