dLLM

DPad: 扩散大语言模型的中庸之道，杜克大学陈怡然团队免训推理加速61倍

论文作者团队：来自杜克大学 CEI Center，由实习生陈欣骅、黄思韬及郭聪博士共同完成，指导教师为李海教授、陈怡然教授。扩散大语言模型（dLLMs）凭借并行解码与独特的全局规划能力，有望解决自回归（AR）大模型的效率瓶瓶颈和规划能力缺陷。但其「全局规划」能力依赖于其双向注意力对所有后文的关注，这带来了严重的计算冗余，从而导致现有开源模型的潜力远远未被释放。

9/9/2025 5:06:00 PM

机器之心

资讯热榜

谷歌新 AI “Nano Banana” 一周吸引千万用户，图像编辑轻松搞定！ OpenAI 挥剑指向 LinkedIn，将于2026年推出 AI 招聘平台突发！Claude AI 宣布封禁中国控股公司，在哪都不行华纳兄弟发起 “反击战”：起诉AI图像生成公司Midjourney OpenAI 推出 AI 招聘平台，计划与 LinkedIn 竞争拍我AI接入谷歌 Nano Banana，开启六天免费创作狂欢玩出新花样！教你用Lovart + Nano Banana无脑批量制作知识卡片海报！ DeepSeek新大招曝光：下一步智能体

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能 Meta 用户微软 GPT 学习技术图像 Gemini 马斯克智能体 AI创作 AI新词 Anthropic 英伟达论文训练代码算法 LLM Stable Diffusion 芯片腾讯蛋白质开发者 Claude 苹果 AI for Science Agent 生成式神经网络机器学习 3D 研究 xAI 生成人形机器人 AI视频百度计算 Sora 工具 GPU 华为大语言模型 RAG AI设计字节跳动具身智能搜索大型语言模型场景深度学习视频生成预测 AGI 视觉伟达架构 Transformer 神器推荐亚马逊特斯拉编程 MCP Copilot