AI在线 AI在线

商汤科技迈向多模态大模型的新纪元

在过去的两年里,人工智能领域的关注点逐渐转向了大模型的技术发展,而商汤科技作为一家成立不到十年的公司,凭借其在计算机视觉领域的技术积累,正迅速转型,迎接这一浪潮。 尽管在2023年之前,商汤主要聚焦于视觉模型,但随着 DeepSeek R1的发布,市场的重心开始向自然语言处理和大规模参数模型倾斜,商汤的策略也随之调整。 商汤于4月10日推出的全新6000亿参数多模态大模型 “日日新 Sense Nova V6”,展现了强大的综合能力,与国际领先的 GPT-4.5和 Gemini2.0Pro 不相上下。

在过去的两年里,人工智能领域的关注点逐渐转向了大模型的技术发展,而商汤科技作为一家成立不到十年的公司,凭借其在计算机视觉领域的技术积累,正迅速转型,迎接这一浪潮。尽管在2023年之前,商汤主要聚焦于视觉模型,但随着 DeepSeek R1的发布,市场的重心开始向自然语言处理和大规模参数模型倾斜,商汤的策略也随之调整。

商汤于4月10日推出的全新6000亿参数多模态大模型 “日日新 Sense Nova V6”,展现了强大的综合能力,与国际领先的 GPT-4.5和 Gemini2.0Pro 不相上下。商汤不仅成功弥补了文本模型的差距,更在多模态领域厚积薄发,标志着其在国内大模型市场中越来越重要的地位。

元宇宙 科幻 赛博朋克 绘画 (5)大模型

图源备注:图片由AI生成,图片授权服务商Midjourney

值得注意的是,商汤在构建其多模态模型的过程中,采用了独特的思维链构建方法。通过将文本、图像、语音和视频数据融合,商汤的日日新 V6能在同一上下文中进行有效的推理,达到1+1>2的效果。这一创新不仅提升了模型的理解与生成能力,也使得多模态之间的协同作用更加显著。

当前,尽管市场上出现了众多多模态模型,能够同时处理多种数据模态的产品依然屈指可数。商汤的日日新 V6凭借其在多模态数据融合方面的成功,逐渐显示出其在未来人工智能竞争中的强大潜力。

相关资讯

商汤小浣熊家族全面升级:多模态融合 10秒钟即可复刻网页

2月25日,商汤科技在2025全球开发者先锋大会上宣布其AI生产力工具——商汤小浣熊家族全面升级,进一步强化多模态能力,推动AI应用加速落地,向AI Agent演进。 此次升级不仅提升了工具的性能,还让AI回归其最朴素的使命——成为强有力的生产力工具。 商汤小浣熊家族的升级涵盖了多个方面。
2/25/2025 11:15:00 AM
AI在线

商汤即将发布“日日新5.5”,现场将签约多项重磅合作

商汤科技将发布“日日新5.5”,混合模态能力大幅提升据消息,2024年7月5日,在世界人工智能大会(WAIC 2024)上,商汤科技在“大爱无疆·向新力”人工智能论坛将发布“日日新5.5”版本,全面升级“云、端、边”大模型产品矩阵,同时进行多项重磅合作的签约发布,加速生成式AI向产业落地的全面跃迁。 商汤发布日日新5.5版本,混合模态能力大幅提升据悉,基于基础模型的技术领先优势,本次商汤推出的“日日新5.5”大模型体系的多模态能力大幅升级。 此前,商汤在今年推出的“日日新5.0”大模型体系,其多模态图文感知能力、文生图能力就已经达到全球领先水平,并在多个多模态大模型权威综合基准测试中综合取得SOTA。
6/26/2024 4:43:00 PM
我在思考中

商汤大模型的「5o」交互,普通人如何和 AI 过一天?

在商汤的演示下,日日新5o拥有像人一样的实时视觉能力,可以跟人进行流畅的视频交互——能听、能说、能看、无延时,它可以通过摄像头 语音实现和用户的实时交互,并获知用户所在的真实场景下的各种状态信息,打破了与AI交互的次元壁,实现了与AI的“视频通话”,已经具备真人聊天般的交互体验。 两个月前OpenAI推出了GPT-4o,以突破性的智能交互能力,彻底颠覆了我们对AI语音助手的认知,颠覆了过去的人机交互,给业界带来又一次震撼。 震撼之外,中国大模型界对GPT-4o的认知似乎并不如GPT-4那么统一,有人认为「在实现AGI的路上,GPT-4o并不重要」、有人评价「在技术突破上,GPT-4o没那么惊艳」;有人认为GPT-4o的发布是 AI 2.0 时代的标志性事件,会催生全新的应用平台和商业模式。
7/15/2024 6:42:00 PM
张进
  • 1