AI在线 AI在线

LLaDA2.0

里程碑时刻!首个100B扩散语言模型来了,技术报告揭秘背后细节

万万没想到,年初还是个小众方向的「扩散语言模型(dLLM)」,现在已经被扩展到千亿参数的规模了。 前段时间,我们在 HuggingFace 页面发现了两个新模型:LLaDA2.0-mini 和 LLaDA2.0-flash。 它们来自蚂蚁集团与人大、浙大、西湖大学组成的联合团队,都采用了 MoE 架构。
12/12/2025 1:16:00 PM
机器之心