AI在线 AI在线

NSP架构

智源发布Emu3.5大模型:以“下一状态预测”重构多模态智能,具身操作能力惊艳业界

当大模型不再只是“看图说话”或“文生图”,而是能像人类一样在复杂环境中理解、规划并执行跨模态操作,多模态AI正迎来质的飞跃。 10月30日,北京智源人工智能研究院正式发布其新一代多模态世界模型——Emu3.5,首次将自回归式“下一状态预测”(Next-State Prediction, NSP)引入多模态序列建模,标志着AI从“感知理解”迈向“智能操作”的关键一步。 NSP架构:让AI学会“预测世界如何变化”Emu3.5的核心突破在于其统一的NSP框架:模型将文本、图像、动作指令等多模态输入视为连续状态序列,通过预测“下一个状态”来实现端到端的智能推理。
10/30/2025 3:36:16 PM
AI在线
  • 1