AI在线 AI在线

加拿大蒙特利尔三星先进技术研究所

700万参数击败DeepSeek R1等,三星一人独作爆火,用递归颠覆大模型推理

Training Small, Thinking Big.大模型的推理架构颠覆的未免有些太快了。 今年 6 月,来自 Sapient Intelligence 的研究者提出了分层推理模型(HRM),用循环架构打破了传统思维链(CoT)的架构限制,对大模型推理结构产生了重大的影响。 HRM 仅包含 2700 万个参数(大约比最小的 Qwen3 0.6B 模型小 22 倍),仅使用 1000 个训练样本,便在复杂的推理任务上取得了卓越的性能。
10/9/2025 1:05:00 PM
机器之心
  • 1