空间智能
CES 2026超前瞻:空间智能来势汹汹!从实验室奢侈品到消费级刚需,如何重塑 AI 具身时代?
明天,一年一度的 CES 即将在美国拉斯维加斯璀璨开幕。 作为全球科技产业最重要的风向标之一,笔者在超前探访之后欣喜发现,在今年机器人「后厨翻炒」与 AI 眼镜「同声传译」的热闹之外,行业终于开始直面核心命题:无法理解三维空间的 AI,终究只是缺乏行动力的 「语言巨人」。 如何解题?
高德布局“世界模型”并成立具身业务部,从地图导航跨越至具身智能
阿里巴巴旗下高德地图正迎来品牌历史上最重大的技术转型。 自2025年8月宣布全面 AI 化并转向空间智能领域以来,高德近期在空间智能评测基准 WorldScore 中展现出统治力,凭借自研的世界模型夺得多个指标的第一名。 该基准由斯坦福大学李飞飞教授团队提出,是目前评估多模态世界生成模型最权威的开源标准,这意味着高德已具备理解并模拟复杂物理世界规律的顶尖能力。
中山大学王广润:大模型的微调只是对空间建模的微调 | GAIR 2025
相比于虚拟世界,真实的世界充斥着动态变化的环境变量和各种各样的物理规则,这要求基础模型不仅具备强大的感知与计算能力,更需拥有理解物理规律、预判场景变化的综合能力。 在此背景下,基础模型的能力边界不断被突破,而新一代AI架构与物理世界建模作为全球AI领域最核心的前沿探索方向之一,更是成为技术突破的关键抓手。 如何通过新一代AI架构的创新迭代,赋能物理世界建模的精准化、高效化,让AI更好地理解、建模并交互物理环境。
李飞飞最新思考:语言模型救不了机器人
过去几年里,AI 行业的节奏快得近乎失真。 模型一次次刷新极限,产品迭代像在抢时间,讨论从“推理成本”到“智能涌现”再到“AGI 时间表”,情绪在乐观与焦虑之间来回摆动。 在这样密集的技术周期里,很少有人愿意停下来思考一个更基本的问题:我们到底在追求怎样的智能?
周末来造梦!李飞飞世界模型正式开放,能力升级,有免费版
a brave new world.是的,这个周末,又有得玩了! 今天,李飞飞的「空间智能」团队正式放出了 Marble —— 一款先进的、多模态生成式世界模型,直接面向所有人开放,真的做到:人人可用、随手造世界。 两个月前,团队才刚放出预览版:一张图、一句话,就能生成一个完整 3D 世界。
商汤日日新开源模型实现空间智能性能突破,多项评测领先 GPT-5
今天,商汤日日新在空间智能领域实现重要突破,正式发布并开源SenseNova-SI系列模型。 在多项权威评测的空间理解和推理任务上,SenseNova-SI 不仅大幅度领先同量级开源多模态大模型,还超越了 GPT-5 和 Gemini 2.5 Pro 等国际顶尖闭源模型的表现。 空间智能短板与系统性解决当下行业领先的大模型,虽然在知识、写作、推理、编程等方面展示了突出的性能,但是普遍存在一个重要的缺陷,就是对空间结构的理解和推理存在很严重的短板,而这恰恰是具身智能体与世界交互所需要的关键基础能力。
李飞飞最新长文:AI的下一个十年——构建真正具备空间智能的机器
就在昨晚,关于其投身的空间智能,斯坦福大学教授李飞飞发表了一篇长篇博客《From Words to Worlds: Spatial Intelligence is AI’s Next Frontier》。 在文中,李飞飞详细解读了「空间智能究竟是什么? 它为什么重要?
从扫街榜到Robotaxi,空间智能彻底打开了高德的想象空间
这周一,一张神秘海报在科技圈引发热议。 「高德要造车了? 」「高德要造飞行汽车?
天猫精灵全屋智能3.0发布,让家拥有感知力的空间智能时代来临
在 2025 年云栖大会的 “智能终端 未来生活” 展区,一个未来之家的实景体验吸引了人群:随着体验者步入展区的客厅空间,AI 传感器识别行走动线,迎宾灯光缓缓亮起;落座沙发,无需动手,氛围 AI Agent 自主联动中央空调、空气净化器及智能沙发等场景设备,营造放松智能居家环境;当体验者步入卧室空间,一句 “天猫精灵,我要休息了” 唤起智能床备好 “哄睡模式” 并等待为用户记录睡眠数据,场景灯光自动呼吸调整成睡眠场景模式。 这并非科幻场景,而是阿里巴巴天猫精灵全屋智能 3.0 带来的现实变革,它宣告着智能家居正式迈入 “空间智能” 时代 —— 家,开始拥有感知与思考的能力。 云栖大会天猫精灵展区战略升级:三大能力构筑空间智能基石天猫精灵生态业务在云栖大会上宣布全面升级 “空间智能” 战略,坚定投入三大核心能力建设,推动行业从 “设备联网” 向 “空间觉醒” 的历史性跨越。
群核科技发布3D高斯语义数据集,给机器人装上“空间大脑”
7月25日,群核科技发布最新高质量3D高斯语义数据集InteriorGS,旨在为机器人和AI智能体提升空间感知能力。 InteriorGS数据集及相应智能体解决方案将亮相2025世界人工智能大会。 据悉,InteriorGS数据集包含1000个3D高斯语义场景,涵盖超 80 种室内环境,赋予智能体一个“空间大脑”,以提高其环境理解和交互能力。
李飞飞最新访谈:没有空间智能,AGI就不完整
闻乐 不圆 发自 凹非寺. 量子位 | 公众号 QbitAI在我看来,没有空间智能,通用人工智能就不完整。 这是“AI教母”李飞飞在最新访谈中对AGI的判断——是的,李飞飞也开始谈论AGI了。
杭州六小龙群核科技递表港交所,冲击全球空间智能第一股,李飞飞看中的万亿赛道
卷大语言模型毫无意义,实现 AGI 必须另起炉灶,构建具备物理认知的感知学习系统。 这是 Meta 首席 AI 科学家,图灵奖得主 Yann LeCun 最近在巴黎 AI 行动峰会对单语言模态下达的「最后通牒」。 虽然对语言模型的看法不同,这也在一定程度上印证了李飞飞的判断:AI 已经获得了语言智能,但要向 AGI 迈进,必须解锁空间智能的维度。
昆仑万维发布Matrix-Zero世界模型:国内首创3D场景与可交互视频生成
昆仑万维今日宣布正式推出其Matrix-Zero世界模型,成为国内首家同时具备3D场景生成和可交互视频生成能力的人工智能企业,标志着其在空间智能领域迈出了重要一步。 Matrix-Zero的核心亮点在于其强大的3D场景生成功能。 该功能可以将用户输入的图片转化为具有全局一致性、可自由探索的真实3D场景。
昆仑万维发布Matrix-Zero世界模型 支持3D场景、可交互视频生成
2025年2月14日,昆仑万维集团正式推出Matrix-Zero世界模型,标志着中国在空间智能领域迈出了重要一步。 Matrix-Zero包含两款子模型:3D场景生成大模型和可交互视频生成大模型,旨在通过AI技术重塑数字内容创作模式,推动影视制作、游戏开发、具身智能等行业的创新发展。 Matrix-Zero的3D场景生成大模型能够将用户输入的图片转化为可自由探索的真实3D场景,支持不同风格的图片输入和风格迁移,并具备动态场景生成能力。
李飞飞、谢赛宁等探索MLLM「视觉空间智能」,网友:2025有盼头了
希望 2025 年 AI 领域能带来推理之外的突破。 在购买家具时,我们会尝试回忆起我们的客厅,以想象一个心仪的橱柜是否合适。 虽然估计距离是困难的,但即使只是看过一次,人类也能在脑海里重建空间,回忆起房间里的物体、它们的位置和大小。
李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪
人类的沟通交流充满了多模态的信息。 为了与他人进行有效沟通,我们既使用言语语言,也使用身体语言,比如手势、面部表情、身体姿势和情绪表达。 因此,为了理解和生成人类动作,理解这些多模态的行为至关重要,而且这一研究方向最近受到的关注也越来越多。
李飞飞:World Labs这样实现「空间智能」
遵循世界的 3D 特性,很多事就会变得自然而然。 说到斯坦福大学教授李飞飞(Fei-Fei Li),她提倡的「空间智能」最近正在引领 AI 发展方向。 李飞飞已经在人工智能历史上赢得了一席之地,她多年来一直致力于创建 ImageNet 数据集和竞赛,在深度学习革命中发挥了重要作用。
AI 靠单图生成 3D 世界:李飞飞空间智能首秀,可像玩游戏一样探索
重点在于,生成的 3D 世界具有交互性。用户能够像玩游戏那样,自由地移动相机来探索这个 3D 世界,浅景深、希区柯克变焦等操作均可行。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉