AI在线 AI在线

商汤日日新开源模型实现空间智能性能突破,多项评测领先 GPT-5

今天,商汤日日新在空间智能领域实现重要突破,正式发布并开源SenseNova-SI系列模型。 在多项权威评测的空间理解和推理任务上,SenseNova-SI 不仅大幅度领先同量级开源多模态大模型,还超越了 GPT-5 和 Gemini 2.5 Pro 等国际顶尖闭源模型的表现。 空间智能短板与系统性解决当下行业领先的大模型,虽然在知识、写作、推理、编程等方面展示了突出的性能,但是普遍存在一个重要的缺陷,就是对空间结构的理解和推理存在很严重的短板,而这恰恰是具身智能体与世界交互所需要的关键基础能力。

今天,商汤日日新在空间智能领域实现重要突破,正式发布并开源SenseNova-SI系列模型。在多项权威评测的空间理解和推理任务上,SenseNova-SI 不仅大幅度领先同量级开源多模态大模型,还超越了 GPT-5 和 Gemini 2.5 Pro 等国际顶尖闭源模型的表现。

空间智能短板与系统性解决

当下行业领先的大模型,虽然在知识、写作、推理、编程等方面展示了突出的性能,但是普遍存在一个重要的缺陷,就是对空间结构的理解和推理存在很严重的短板,而这恰恰是具身智能体与世界交互所需要的关键基础能力。

我们来看一个例子,左图源自最强大脑的图形推理题,对人类都具有相当的难度,GPT-5能够轻松破解,可见它在非空间智能问题上已具备很强能力。反观右图,是一道人类儿童都能轻易解决的简单空间问题,要求选择正确俯视图,GPT-5却令人意外地犯起了难,错误地选择了"A”。商汤日日新开源模型实现空间智能性能突破,多项评测领先 GPT-5

以上例子恰好暴露了当前大模型在空间理解上的短板。因此要让AI真正"看懂"三维世界,空间智能一直是关键的试金石。

商汤围绕空间智能进行了深入创新探索,找到了提升空间智能的系统性训练方法,打造了日日新·空间智能大模型系列 SenseNova-SI 并正式开源。

评测表现多项任务超越GPT-5,显著领先同量级开源模型

这次开源的SenseNova-SI空间智能大模型系列包括 2B 和 8B 两个规格。

最新评测数据显示,SenseNova-SI系列模型在空间智能多个基准测试(VSI、MMSI、MindCube、ViewSpatial)中表现突出,具体如下:商汤日日新开源模型实现空间智能性能突破,多项评测领先 GPT-5

数据来源:https://github.com/OpenSenseNova/SenseNova-SI

其中SenseNova-SI-8B模型在四个基本评测中获得 60.99 的平均成绩,不仅大幅领先Qwen3-VL-8B(40.16)、BAGEL-7B(35.01)等开源通用多模态模型,以及 SpatialMLLM(35.05)、ViLaSR-7B(36.41) 等专门的空间智能模型,还以相对轻量的模型规格实现了对GPT-5(49.68)、Gemini-2.5-Pro(48.81)等顶级闭源模型的超越。这里显著的性能提升反映了模型在空间智能上获得了质的突破,而不是简单的性能改善。

基于"尺度效应"的训练范式,实现能力系统性提升

SenseNova-SI的性能飞跃,源于商汤从训练数据到方法上的系统性方案。依托商汤提出的空间能力分类体系和过往多样化的数据的积累,团队采用系统化的方法扩充空间理解数据的规模,首次在空间智能领域验证了“尺度效应”,即通过高质量、大规模数据训练,可显著提升模型的空间认知能力。

商汤提出的训练范式具备通用性,能够针对不同架构的基模型(如InternVL等)进行有效增强,使其在空间智能六大核心维度上——包括空间测量、空间重构、空间关系、视角转换、空间形变与空间推理——实现一致性的能力提升。

商汤稍后将发布详细的技术报告,详细阐述具体的技术方案。

以下为GPT-5和SenseNova-SI-8B模型面对空间智能问题,给出的答案对比。商汤日日新开源模型实现空间智能性能突破,多项评测领先 GPT-5

给出的立方体组合图形,要求选择正确俯视图。GPT-5选择答案D,SenseNova-SI-8B选择答案B,正确答案为B。(例题源自SITE-Bench)商汤日日新开源模型实现空间智能性能突破,多项评测领先 GPT-5

假设我站在手持相机人的位置,并且面朝他现在面朝的方向。摩托车是位于我的左侧还是右侧? GPT-5选择答案A(左侧),SenseNova-SI-8B选择答案B,正确答案为B(右侧)。(例题源自SITE-Bench)商汤日日新开源模型实现空间智能性能突破,多项评测领先 GPT-5

多车道道路场景,判断黄色汽车的后续动作(如直行、转向等)。GPT-5选择答案C(静止),SenseNova-SI-8B选择答案(D),正确答案为D(右转)。(例题源自SITE-Bench)商汤日日新开源模型实现空间智能性能突破,多项评测领先 GPT-5

同一户外场景,通过视角变化判断移动方向GPT-5选择答案C,SenseNova-SI-8B选择答案D,正确答案为向左前方移动(选项D)。(例题源自MindCube)商汤日日新开源模型实现空间智能性能突破,多项评测领先 GPT-5

同一室内空间,包含白板、椅子和沙发等,通过物体位置变化分析移动方向。GPT-5选择答案D,SenseNova-SI-8B选择答案A,正确答案为向左前方移动(选项A)。(例题源自MindCube)商汤日日新开源模型实现空间智能性能突破,多项评测领先 GPT-5

从不同角度拍摄带黑色衣物的桌子,从正面视角(图1)判断桌子右侧物体。GPT-5选择答案B,SenseNova-SI-8B选择答案C,正确答案为门(选项C)。(例题源自MindCube)

推动世界模型和具身智能生态发展

空间智能是世界模型与具身智能理解物理世界的基础能力。今年7月,商汤正式发布“悟能”具身智能平台,该平台以商汤“开悟”世界模型为核心引擎,旨在为机器人和智能设备提供在物理世界中自主探索和进化的能力。

此次发布的空间智能大模型SenseNova-SI,与“开悟”世界模型相辅相成,将更好地解决多模态模型从数字空间走向物理世界的基础挑战,并在未来进一步推动AI在自动驾驶、机器人等场景的应用。

此外,商汤还同步开源了空间智能测评平台 EASI(https://github.com/EvolvingLMMs-Lab/EASI)与“英雄榜”,旨在推动空间智能技术评估标准的统一,持续跟踪并展示开源和闭源模型的性能进展,为学术界和工业界提供权威的评估基准,促进协同创新。

商汤SenseNova-SI的推出标志着AI在三维世界理解能力上迈出关键一步,也为下一代通用人工智能技术融入物理世界打下坚实基础。

相关资讯

商汤科技推出Claude API用户迁移计划 提供5000万Token免费体验

面对Anthropic最新发布的服务限制政策,商汤科技迅速推出了针对Claude API用户的迁移支持计划,帮助受影响用户平滑过渡至自家"日日新"SenseNova大模型平台。 根据Anthropic近期公布的政策,该公司将停止向中国控股超过50%的企业及其子公司提供Claude等AI服务,这一限制涵盖全球范围内的相关企业,不论其运营地点。 这一政策变化让众多依赖Claude服务的用户面临服务中断的困扰。
9/9/2025 11:15:43 AM
AI在线

OpenAI 突然断供中国!商汤推出0成本“搬家服务”,还送大礼包

6月25日,商汤科技宣布推出大模型0元购计划,即日起成为商汤“日日新SenseNova”新注册企业用户,将获得涉及调用、迁徙、训练等多项免费服务大礼包,0元GO!“日日新SenseNova”平台覆盖商量大语言模型、商量图文多模态大模型、秒画文生图大模型、语音大模型、向量模型等多类模型API接口,满足企业用户不同需求。商汤始终坚持AI原创,技术安全且自主可控,并自有商汤大装置SenseCore这类高效率、低成本、规模化的新一代AI基础设施,算力有保障。商汤将为“日日新SenseNova”新注册企业用户赠送5000万T
6/26/2024 4:48:00 PM
新闻助手

调查:超72% 的企业选择 AI 工具时最看重易用性

根据最近的一项 CIO 报告,企业在人工智能(AI)领域的投资高达2.5亿美元,尽管在证明投资回报率(ROI)方面面临挑战。 商业领袖们正努力提高生产力,但新技术的集成往往需要重构现有应用、更新流程并激励员工学习,以适应现代商业环境。 QuickBlox 首席执行官 Nate MacLeitch 对136位高管进行了调查,以揭示 AI 采用的现实情况,探讨领导者的首要任务、主要担忧以及他们在2025年寻找可信工具的信息来源。
3/18/2025 10:02:00 AM
AI在线
  • 1