AI在线 AI在线

几何代理任务

欧几里得的礼物:通过几何代理任务增强视觉-语言模型中的空间感知和推理能力

本文共同第一作者为华中科技大学博士生连仕杰与华东师范大学博士生邬长倜,二者同时也是北京中关村学院2024级学生。 共同通讯作者包括:郑州大学学术副校长,郑州大学/华中科技大学教授,加拿大工程院/欧洲科学院院士杨天若教授;北京中关村学院&中关村人工智能研究院具身方向负责人陈凯。 近年来,多模态大语言模型(MLLMs)在广泛的视觉-语言任务中取得了显著成功。
10/17/2025 10:20:00 AM
机器之心
  • 1