世界模型
宇树:开源机器人世界大模型!
一觉醒来,宇树带着最新开源模型来了! 这次开源的是一个世界模型-动作架构,名叫UnifoLM-WMA-0。 它的核心之处在于拥有一个世界模型能够理解机器人和环境相互作用时的物理规律。
9/16/2025 12:21:26 PM
西风
万字长文实录:RL 界与 CV 界的“世界模型”有什么不同?丨GAIR Live
世界模型在人工智能领域中扮演着重要角色,能够有效为智能体提供对复杂现实世界的内在表征,使其像人类一样理解世界运行的逻辑与因果关系,对自动驾驶、具身智能的突破性发展至关重要,它已成为学术界和工业界的研究热点。 圆桌主持人为清华大学智能产业研究院(AIR)助理教授、智源学者赵昊,并邀请了宁波东方理工大学助理教授金鑫、浙江大学特聘研究员廖依伊、布里斯托大学助理教授杨梦月、伯克利人工智能实验室博士后研究员郑文钊一起进行了一场深度的讨论。 会上主持人赵昊带头讨论世界模型,先是探讨其定义、范围,接着分析强化学习界与计算机视觉界的世界模型的不同,随后围绕视频生成、三维重建等内容,剖析通用视频生成模型向真正的世界模型的发展路径,最后关注于落地场景,聚焦于自动驾驶以及具身智能,并探讨构建其世界模型的难点和方向。
9/8/2025 5:11:00 PM
刘欣
SIGGRAPH上,英伟达发布物理AI开源新技术,更新RTX Pro产品线
本周一,在全球图形学领域顶级会议 SIGGRAPH 上,英伟达宣布了一系列新发布。 面向「物理 AI」的愿景,英伟达提出了全新 Omniverse 库和 Cosmos 世界基础模型 (WFM),希望助推机器人解决方案的开发和部署。 这些库和模型由英伟达最新的 RTX PRO 服务器和 NVIDIA DGX Cloud 提供支持,可帮助开发者在任何地方开发物理精确的数字孪生,在仿真环境中捕捉和重建现实世界,生成用于训练物理 AI 模型的合成数据,并构建理解物理世界的 AI 智能体。
8/12/2025 4:19:00 PM
李泽南
DeepMind 没舍得开源的 Genie 3,被昆仑万维放出来了
过去一周,世界模型赛道的热度被推到新高。 DeepMind 刚发布的 Genie 3 展示了交互式、实时、长序列生成的能力,让“虚拟世界随时可玩、可控”从概念变成了可见的产品形态。 不过,Genie 3 虽然惊艳,却并未开源,这让不少开发者只能停留在猜测其技术细节的阶段。
8/12/2025 2:15:00 PM
郑佳美
此即未来!Google重磅上线通用世界模型Genie 3
今天除了 OpenAI 开源的 gpt-oss 之外,还有一个我觉得非常值得一说的东西。 就是 Google 发布的这个世界模型,Genie 3。 更多谷歌模型介绍:作为一个将近 20 年的游戏玩家和近 10 年的 VR 玩家,我看到这个视频的时候,心真的在怦怦跳。
8/7/2025 6:25:26 AM
数字生命卡兹克
理想i8正式发布:首款纯电SUV,售价32.18万元起
7 月 29 日晚,理想汽车正式发布家庭六座纯电 SUV—— 理想 i8。 作为旗下首款纯电 SUV,理想 i8 价格定位在 32.18 万元 - 36.98 万元,并将于 8 月 20 日开启交付,目前已可以在全国零售门店试驾体验了。 理想 i8 的设计理念源于游艇,其延续了 MEGA 的前脸设计风格,尾部则与理想 L 系 SUV 类似,首发提供五款车身外观色,三款内饰配色,可选 20、21 英寸轮毂。
7/29/2025 11:45:00 PM
新闻助手
「世界模型」也被泼冷水了?邢波等人揭开五大「硬伤」,提出新范式
现在的世界模型,值得批判。 我们知道,大语言模型(LLM)是通过预测对话的下一个单词的形式产生输出的。 由此产生的对话、推理甚至创作能力已经接近人类智力水平。
7/9/2025 3:44:00 PM
机器之心
LeCun亲自出镜打脸质疑者!憋了20年的AI世界模型,终于爆发了
正处于风暴中心的LeCun,亲自出镜了! 在视频中,他介绍了V-JEPA 2的新进展,目标就是开发能改变AI与物理世界交互方式的世界模型。 图片可见,对于Meta刚刚发布的这个博客,LeCun真的格外用心。
6/12/2025 2:32:07 PM
新智元
Meta 推出名为 V-JEPA 2 的“世界模型”,助力机器人理解物理世界
Meta发布最新AI模型V-JEPA 2,旨在帮助AI智能体理解物理世界,预测事件发展。该模型训练数据超100万小时视频,运行速度比Nvidia Cosmos快30倍。Meta首席AI科学家Yann LeCun称其将开启机器人技术新纪元。#人工智能##MetaAI#
6/12/2025 11:14:15 AM
远洋
刚刚,LeCun亲自出镜,Meta推出新世界模型!
最近,Meta 大动作不断。 前些天有外媒曝出马克・扎克伯格正在组建一个名为「超级智能团队」的专家团队,以实现通用人工智能。 随后开出 9 位数的薪酬为该团队吸纳人才。
6/12/2025 9:37:30 AM
机器之心
智源研究院发布“悟界”系列大模型,含全球首个原生多模态世界模型 Emu3
北京智源人工智能研究院今日发布“悟界”系列大模型,包括全球首个原生多模态世界模型“悟界・Emu3”、全球首个脑科学多模态通用基础模型“悟界・见微 Brainμ”。
6/6/2025 11:21:19 AM
清源
DeepMind闭关修炼「我的世界」,自学成才挖钻登Nature!人类玩家瑟瑟发抖
AI又进化了,在没有任何人类数据的参与下,自己玩《我的世界》还能找到钻石! 在刚刚登上Nature的论文中,谷歌DeepMind的智能体通过纯·自我学习,顺利完成了收集钻石的任务。 图片论文链接:,DeepMind的计算机科学家Danijar Hafner表示:「Dreamer是一个重要的里程碑,标志着AI又朝着通用人工智能前进了一大步。
4/7/2025 3:00:00 AM
新智元
CityDreamer4D: 下一个世界模型,何必是视频生成模型?
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected];[email protected]。
1/28/2025 1:19:00 PM
机器之心
JHU 陈杰能:世界模型+心智模型,让具身智能体拥有「想象力」
作者 | 赖文昕编辑 | 陈彩娴近日,马尔奖得主、约翰霍普金斯大学教授 Alan Yuille 的团队发布了一项世界模型方向的重磅工作——GenEx,引起了具身智能领域的广泛讨论与关注。 作为李飞飞初创公司 World Labs 发布的同期工作,生成模型 GenEx 的特别之处在于它能让 AI 具有"想象力",使智能体通过想象出来的观测探索生成式世界。 受到心智模型的启发,GenEx 希望在一定程度上试图模拟人类大脑中对世界的认知方式和理解机制,以实现更智能、更灵活的人工智能系统。
12/30/2024 3:05:00 PM
赖文昕
出手即王炸?照片级真实度生成式世界模型,还获得皮克斯和Jeff Dean投资
世界模型正在爆发! 近段时间,世界模型的相关研究成果正如雨后春笋版不断涌现,光是我们报道过的就已有南大周志华团队的世界模型 Whale、Yann LeCun 团队的世界模型研究、李飞飞 World Labs 的空间智能研究、谷歌的强大世界模型 Genie 2 以及刚刚开源的像是能模拟万物的生成式物理引擎 Genesis。 事实上,在 Genesis 开源发布的差不多时间,一家名为 Odyssey 的创业公司也向世界介绍了他们的世界模型 Explorer。
12/20/2024 1:36:00 PM
机器之心
18k个视频、专为自动驾驶世界模型设计,DrivingDojo数据集来了
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
12/9/2024 2:12:00 PM
机器之心
LeCun团队新作:在世界模型中导航
现实世界版的 Genie-2? 最近,世界模型(World Models)似乎成为了 AI 领域最热门的研究方向。 继 World Labs(李飞飞)、谷歌 DeepMind 接连发布自己的世界模型研究之后,Meta FAIR 的 Yann LeCun 团队也加入了战场,也在同一周之内发布了导航世界模型(Navigation World Models/NWM)。
12/7/2024 5:04:00 PM
机器之心
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
图像
Gemini
智能体
马斯克
AI新词
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
计算
工具
Sora
GPU
大语言模型
华为
RAG
AI设计
字节跳动
具身智能
搜索
大型语言模型
场景
深度学习
AGI
视频生成
预测
视觉
伟达
架构
Transformer
神器推荐
DeepMind
亚马逊
特斯拉
编程
AI模型