AI在线 AI在线

dLLM

DPad: 扩散大语言模型的中庸之道,杜克大学陈怡然团队免训推理加速61倍

论文作者团队:来自杜克大学 CEI Center,由实习生陈欣骅、黄思韬及郭聪博士共同完成,指导教师为李海教授、陈怡然教授。 扩散大语言模型(dLLMs)凭借并行解码与独特的全局规划能力,有望解决自回归(AR)大模型的效率瓶瓶颈和规划能力缺陷。 但其「全局规划」能力依赖于其双向注意力对所有后文的关注,这带来了严重的计算冗余,从而导致现有开源模型的潜力远远未被释放。
9/9/2025 5:06:00 PM
机器之心
  • 1