AI在线 AI在线

商汤「日日新V6.5」登顶OpenCompass全球多模态大模型榜单

根据权威评测平台OpenCompass多模态大模型学术榜单(Multi-modal Academic Leaderboard)最新数据显示,商汤「日日新 V6.5」(SenseNova-V6.5 Pro)多模态大模型以82.2的综合成绩登顶榜首,领先Gemini 2.5 Pro以及GPT-5等国际顶尖模型。 这一佳绩不仅意味着商汤「日日新 V6.5」成为全球最强多模态大模型之一,同时也是商汤在“多模态通用智能”技术战略下的成果印证。 商汤科技联合创始人、执行董事、首席科学家林达华在《迈向多模态通用智能:商汤的思考》中指出,智能的核心是与外界进行自主交互的能力,多模态信息感知与处理的能力是AGI的核心要求,使AI能像人类一样,通过视觉、听觉等多种感官接收并融合信息,实现更深层次的理解与推理,是迈向AGI的必由之路。

根据权威评测平台OpenCompass多模态大模型学术榜单(Multi-modal Academic Leaderboard)最新数据显示,商汤「日日新 V6.5」(SenseNova-V6.5 Pro)多模态大模型以82.2的综合成绩登顶榜首,领先Gemini 2.5 Pro以及GPT-5等国际顶尖模型。

商汤「日日新V6.5」登顶OpenCompass全球多模态大模型榜单

这一佳绩不仅意味着商汤「日日新 V6.5」成为全球最强多模态大模型之一,同时也是商汤在“多模态通用智能”技术战略下的成果印证。商汤科技联合创始人、执行董事、首席科学家林达华在《迈向多模态通用智能:商汤的思考》中指出,智能的核心是与外界进行自主交互的能力,多模态信息感知与处理的能力是AGI的核心要求,使AI能像人类一样,通过视觉、听觉等多种感官接收并融合信息,实现更深层次的理解与推理,是迈向AGI的必由之路。

商汤「日日新V6.5」正是商汤科技以多模态为技术主轴下的最新成果。在国内率先突破“图文交错思维链”技术,「日日新V6.5」能够像人一样,实现逻辑思维和形象思维的结合,可将部分思考过程转化为图形化表达,具备真正的多模态思考能力,成为国内首个拥有形象思维,实现图文交错思维的商业级大模型。

同时,凭借以思维链为载体、强化学习为主要途径的新范式,「日日新V6.5」能够在“生成-验证-学习”的算法闭环中持续改进自身的思维,推理性能大幅提升,其中在数理、代码、GUI操作、图表分析、高阶任务等维度的提升尤为显著。

商汤「日日新V6.5」还通过架构更新,采用轻量化的视觉编码器,同时加深MLLM主干网络,在保证同样性能的前提下,实现3倍以上的效率提升,使性能成本曲线显著优化,效费比优于Gemini 2.5等国际模型。

在以多模态通向通用人工智能(AGI)的过程,商汤科技以“基础设施-模型-应用”三位一体的总体战略,致力于打造业界领先的通用多模态大模型,并在真实场景牵引下,构建端到端的产品技术竞争力。以不断进化的多模态大模型能力为基础,商汤科技持续推动多模态AI从数字空间走入真实的物理世界,在真实场景中提供端到端的价值。

OpenCompass大模型开放评测体系是上海人工智能实验室推出的一站式、大模型评估平台,致力于提供公平、开源、可复现的评测标准,覆盖了语言、多模、安全、具身智能、金融与医疗等多个方面通用能力和垂类领域评测,是对大模型真实能力各个维度进行全面诊断的专业综合榜单。多模态模型公开学术榜单精选国内外具有广泛影响力的开源学术评测集,对行业多模态模型进行评测,采用主客观评测相结合的评测手段,运用了CircularEval、LLM-as-a-Judge等策略,被业界视为反映大模型“应用价值”的重要参考。

相关资讯

商汤坐上大模型核心牌桌

过去两年,关于大模型的讨论视角很少从商汤这样成立不过十年、资源与技术积累正当青壮年的人工智能公司出发。 造成这一现象的主要原因是两个技术周期的迥异:2023 年之前,商汤的人工智能技术路径以计算机视觉模型为主,不同于 ChatGPT 为代表的新技术浪潮:以自然语言处理为主、大规模参数模型为核心。 一个是视觉、一个是语言,在外界看来两个赛道还没有发生直接的关系。
5/9/2025 11:42:00 AM
陈彩娴

国内首个!商汤科技发布“日日新5o”,实时多模态流式交互对标GPT-4o

2024 年 7 月 5 日,上海 ——2024 世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)战略合作伙伴商汤科技召开 “大爱无疆・向新力” 人工智能论坛,发布国内首个所见即所得模型 “日日新 5o”,交互体验对标 GPT-4o,实现全新 AI 交互模式。通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,国内首个所见即所得模型 “日日新 5o” 带来一种全新的 AI 交互模式,即实时的流式多模态交互。现场也为大家展示了这种创新交互模式 ——工作人员刚开始仅是和 “日日新 5o” 打个招
7/5/2024 3:02:00 PM
新闻助手

华为云董理斌:做难事解难题,盘古大模型以“智”重塑千行万业

7 月 5 日,2024 世界人工智能大会暨人工智能全球治理高级别会议 —“盘古大模型重塑千行万业” 分论坛于上海世博中心举办。在 “盘古大模型做难事解难题,以‘智’重塑千行万业” 主题演讲中,华为云 Marketing 部部长董理斌向出席会议的百余名人工智能领域顶尖专家、业界领军人物分享了盘古大模型 5.0 的全新能力,以及盘古大模型深入高铁、钢铁、工业设计、建筑设计、气象等领域,重塑千行万业的应用进展。他表示,盘古大模型 5.0 通过更多的模态和更强的思维能力,重塑云服务,为开发者、客户和伙伴提供更强大、更丰富
7/5/2024 3:08:00 PM
新闻助手
  • 1