AI在线 AI在线

掩码扩散大语言模型

用更一致的轨迹、更少的解码步数「驯服」掩码扩散语言模型,扩散语言模型的推理性能和效率大幅提升

扩散大语言模型得到了突飞猛进的发展,早在 25 年 2 月 Inception Labs 推出 Mercury—— 第一个商业级扩散大型语言模型,同期人民大学发布第一个开源 8B 扩散大语言模型 LLaDA,5 月份 Gemini Diffusion 也接踵而至。 种种迹象表明,扩散大语言模型很可能是下一代大语言模型基础范式的有力竞争者。 但是针对于扩散大语言模型的解码策略和强化学习算法仍然是欠探索的。
11/5/2025 12:54:00 PM
机器之心
  • 1