AI在线 AI在线

OST-Bench

景不动人动,MLLM如何面对「移步换景」的真实世界?OST-Bench揭示多模态大模型在线时空理解短板

多模态大语言模型(MLLMs)已在视觉与语言模态融合的感知与推理任务中展现出强大能力。 而上海人工智能实验室、上海交通大学、香港大学、香港中文大学的研究者们提出的的 OST-Bench, 则是从智能体探索场景的动态在线视角出发,为大模型的能力提出了新的挑战。 对比离线 / 静态的空间智能基准,OST-Bench 更精准地反映了具身感知在真实世界中的核心挑战。
10/14/2025 2:23:00 PM
机器之心
  • 1