世界模型

李飞飞发布全新世界模型，单GPU就能跑！

时令发自凹非寺. 量子位 | 公众号 QbitAI李飞飞的世界模型创业，最新成果来了！刚刚，教母亲自宣布对外推出全新模型RTFM（A Real-Time Frame Model），不仅具备实时运行、持久性和3D一致性，更关键的是——.

10/17/2025 12:39:35 PM 时令

梦里啥都有？谷歌新世界模型纯靠「想象」训练，学会了在《我的世界》里挖钻石

只让机器人或虚拟智能体「想象」，不让它们和物理世界交互，它们也能学到和世界交互的技能？谷歌的世界模型 Dreamer 4 为这一想法提供了新的支撑。为了在具身环境中解决复杂任务，智能体需要深入理解世界并选择成功的行动。

10/2/2025 3:00:00 PM 机器之心

Code World Model (CWM)：用世界模型改善代码生成的开源大语言模型

Meta发布了 Code World Model (CWM，论文：CWM: An Open-Weights LLM for Research on Code Generation with World Models)，一个拥有32B参数的开源大语言模型（LLM），旨在推动基于世界模型的代码生成研究。与传统仅从静态代码训练的模型不同，CWM在大规模 Python解释器执行轨迹和 agent性Docker环境交互轨迹上进行中期训练，并在可验证编码、数学和多轮软件工程环境中进行多任务强化学习（RL）。 CWM为研究者提供了探索世界建模在代码生成中通过推理和规划提升能力的强大平台。

9/28/2025 4:00:00 AM 无影寺

LeCun团队开源首个代码世界模型：能生成代码还能自测自修！传统编程模型一夜成古典

刚刚，Meta FAIR推出了代码世界模型！ CWM（Code World Model），一个参数量为32B、上下文大小达131k token的密集语言模型，专为代码生成和推理打造的研究模型这是全球首个将世界模型系统性引入代码生成的语言模型。图片与现有代码大模型相比，CWM最与众不同的一点在于，它不仅能生成代码、理解语义。

9/25/2025 9:33:54 AM

无需训练，即插即用：西湖大学发布世界模型WorldForge，让普通视频模型秒变「世界引擎」

自 Sora 亮相以来，AI 视频的真实感突飞猛进，但可控性仍是瓶颈：模型像才华横溢却随性的摄影师，难以精准执行 “导演指令”。我们能否让 AI 做到：仅凭一张静态照片，就能 “脑补” 出整个 3D 空间，生成一段围绕主体的 360° 环绕视频？现有的视频能否进行重新运镜，实现推、拉、摇、移等复杂的电影级镜头调度？

9/23/2025 11:25:00 AM 机器之心

李飞飞发布世界模型新成果：一个提示，生成无限3D世界

不圆时令发自凹非寺. 量子位 | 公众号 QbitAI李飞飞创业公司世界模型新成果来了！只需要一个图像或者提示，就能构建出一个可以无限探索的3D世界——【此处无法插入视频，遗憾……可到量子位公众号查看～】世界更大、风格更多样、3D几何结构更清晰，并且保持一致性、没有时间限制、没有奇怪的变形。

9/17/2025 9:58:12 AM 不圆

宇树：开源机器人世界大模型！

9/16/2025 12:21:26 PM 西风

万字长文实录：RL 界与 CV 界的“世界模型”有什么不同？丨GAIR Live

世界模型在人工智能领域中扮演着重要角色，能够有效为智能体提供对复杂现实世界的内在表征，使其像人类一样理解世界运行的逻辑与因果关系，对自动驾驶、具身智能的突破性发展至关重要，它已成为学术界和工业界的研究热点。圆桌主持人为清华大学智能产业研究院（AIR）助理教授、智源学者赵昊，并邀请了宁波东方理工大学助理教授金鑫、浙江大学特聘研究员廖依伊、布里斯托大学助理教授杨梦月、伯克利人工智能实验室博士后研究员郑文钊一起进行了一场深度的讨论。会上主持人赵昊带头讨论世界模型，先是探讨其定义、范围，接着分析强化学习界与计算机视觉界的世界模型的不同，随后围绕视频生成、三维重建等内容，剖析通用视频生成模型向真正的世界模型的发展路径，最后关注于落地场景，聚焦于自动驾驶以及具身智能，并探讨构建其世界模型的难点和方向。

9/8/2025 5:11:00 PM 刘欣

SIGGRAPH上，英伟达发布物理AI开源新技术，更新RTX Pro产品线

本周一，在全球图形学领域顶级会议 SIGGRAPH 上，英伟达宣布了一系列新发布。面向「物理 AI」的愿景，英伟达提出了全新 Omniverse 库和 Cosmos 世界基础模型 (WFM)，希望助推机器人解决方案的开发和部署。这些库和模型由英伟达最新的 RTX PRO 服务器和 NVIDIA DGX Cloud 提供支持，可帮助开发者在任何地方开发物理精确的数字孪生，在仿真环境中捕捉和重建现实世界，生成用于训练物理 AI 模型的合成数据，并构建理解物理世界的 AI 智能体。

8/12/2025 4:19:00 PM 李泽南

DeepMind 没舍得开源的 Genie 3，被昆仑万维放出来了

过去一周，世界模型赛道的热度被推到新高。 DeepMind 刚发布的 Genie 3 展示了交互式、实时、长序列生成的能力，让“虚拟世界随时可玩、可控”从概念变成了可见的产品形态。不过，Genie 3 虽然惊艳，却并未开源，这让不少开发者只能停留在猜测其技术细节的阶段。

8/12/2025 2:15:00 PM 郑佳美

此即未来！Google重磅上线通用世界模型Genie 3

今天除了 OpenAI 开源的 gpt-oss 之外，还有一个我觉得非常值得一说的东西。就是 Google 发布的这个世界模型，Genie 3。更多谷歌模型介绍：作为一个将近 20 年的游戏玩家和近 10 年的 VR 玩家，我看到这个视频的时候，心真的在怦怦跳。

8/7/2025 6:25:26 AM 数字生命卡兹克

理想i8正式发布：首款纯电SUV，售价32.18万元起

7 月 29 日晚，理想汽车正式发布家庭六座纯电 SUV—— 理想 i8。作为旗下首款纯电 SUV，理想 i8 价格定位在 32.18 万元 - 36.98 万元，并将于 8 月 20 日开启交付，目前已可以在全国零售门店试驾体验了。理想 i8 的设计理念源于游艇，其延续了 MEGA 的前脸设计风格，尾部则与理想 L 系 SUV 类似，首发提供五款车身外观色，三款内饰配色，可选 20、21 英寸轮毂。

7/29/2025 11:45:00 PM 新闻助手

「世界模型」也被泼冷水了？邢波等人揭开五大「硬伤」，提出新范式

现在的世界模型，值得批判。我们知道，大语言模型（LLM）是通过预测对话的下一个单词的形式产生输出的。由此产生的对话、推理甚至创作能力已经接近人类智力水平。

7/9/2025 3:44:00 PM 机器之心

LeCun亲自出镜打脸质疑者！憋了20年的AI世界模型，终于爆发了

正处于风暴中心的LeCun，亲自出镜了！在视频中，他介绍了V-JEPA 2的新进展，目标就是开发能改变AI与物理世界交互方式的世界模型。图片可见，对于Meta刚刚发布的这个博客，LeCun真的格外用心。

6/12/2025 2:32:07 PM 新智元

Meta 推出名为 V-JEPA 2 的“世界模型”，助力机器人理解物理世界

6/12/2025 11:14:15 AM 远洋

刚刚，LeCun亲自出镜，Meta推出新世界模型！

最近，Meta 大动作不断。前些天有外媒曝出马克・扎克伯格正在组建一个名为「超级智能团队」的专家团队，以实现通用人工智能。随后开出 9 位数的薪酬为该团队吸纳人才。

6/12/2025 9:37:30 AM 机器之心

智源研究院发布“悟界”系列大模型，含全球首个原生多模态世界模型 Emu3

北京智源人工智能研究院今日发布“悟界”系列大模型，包括全球首个原生多模态世界模型“悟界・Emu3”、全球首个脑科学多模态通用基础模型“悟界・见微 Brainμ”。

6/6/2025 11:21:19 AM 清源

DeepMind闭关修炼「我的世界」，自学成才挖钻登Nature！人类玩家瑟瑟发抖

AI又进化了，在没有任何人类数据的参与下，自己玩《我的世界》还能找到钻石！在刚刚登上Nature的论文中，谷歌DeepMind的智能体通过纯·自我学习，顺利完成了收集钻石的任务。图片论文链接：，DeepMind的计算机科学家Danijar Hafner表示：「Dreamer是一个重要的里程碑，标志着AI又朝着通用人工智能前进了一大步。

4/7/2025 3:00:00 AM 新智元

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ Mac也能跑Qwen3，一文看懂本地部署qwen 3配置要求

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉