AI在线 AI在线

学习率

大模型微调范式认知再被颠覆?UIUC、Amazon团队最新研究指出SFT灾难性遗忘问题或被误解

在大模型微调实践中,SFT(监督微调)几乎成为主流流程的一部分,被广泛应用于各类下游任务和专用场景。 比如,在医疗领域,研究人员往往会用领域专属数据对大模型进行微调,从而显著提升模型在该领域特定任务上的表现。 然而,问题随之而来:SFT 是否会让模型 “遗忘” 原本的通用能力?
10/21/2025 11:56:00 AM
机器之心
  • 1