AI在线 AI在线

遗忘定律

SFT远不如RL?永不过时的剃刀原则打开「终身学习」大模型训练的大门

我们已经进入了大模型时代,越来越多的应用依赖大模型的能力,可以说大模型已经成为智能化基础设施的核心组成部分,支撑着语言,视觉分析,智能驾驶,机器人等各种下游应用。 在大模型的实际使用中我们发现,大部分的模型还只是某个细分领域任务的大牛,离我们理想中的 AGI 仍然遥遥无期。 准确的说,这些投入部署的大模型大多是「静态」模型,对于其预训练或微调时优化的系列任务表现良好,但是在动态学习,自我提升这部分能力是缺位的。
9/9/2025 8:20:00 PM
机器之心
  • 1