AI在线 AI在线

从图像出发构建可控交互世界!昆仑万维正式开源Matrix-Game

5月13日,昆仑万维集团宣布正式开源Matrix-Game大模型,这是一款专注于交互式世界生成的先进模型,标志着交互式世界生成技术的新突破。 Matrix-Game是Matrix系列在交互式世界生成方向的正式落地,也是工业界首个开源的10B 空间智能大模型,专为开放式环境中的高质量生成与精确控制而设计。 这一开源举措不仅刷新了交互式世界生成的技术上限,也为构建通用虚拟世界基座树立了全新标杆。

5月13日,昆仑万维集团宣布正式开源Matrix-Game大模型,这是一款专注于交互式世界生成的先进模型,标志着交互式世界生成技术的新突破。Matrix-Game是Matrix系列在交互式世界生成方向的正式落地,也是工业界首个开源的10B+空间智能大模型,专为开放式环境中的高质量生成与精确控制而设计。这一开源举措不仅刷新了交互式世界生成的技术上限,也为构建通用虚拟世界基座树立了全新标杆。

Matrix-Game由三大核心部分构成:Matrix-Game-MC数据集、Matrix-Game主模型和GameWorld Score评测体系。Matrix-Game-MC数据集是一个自主构建的大规模交互世界数据集,包含大规模无标签的Minecraft游戏视频和带有键盘与鼠标控制信号的Minecraft与Unreal可控视频数据,具备精细的动作注释。这一数据集支持对复杂环境动态与交互模式的高效建模与学习。

微信截图_20250513101341.png

Matrix-Game主模型基于先进扩散模型技术开发,能够根据用户输入生成连贯、可控的互动视频,兼顾视觉质量、时序一致性与物理合理性。该模型通过两阶段训练策略(无标签数据预训练+标注数据可控训练),在空间理解、用户指令响应以及物理交互建模等方面取得了显著提升。Matrix-Game具备细粒度用户交互控制能力,支持前进、跳跃、攻击、视角移动等细节操作,操作体验准确自然。同时,生成结果在保持视觉连贯的同时,遵循自然物理规律,如重力、碰撞等,显著提升沉浸感。此外,Matrix-Game还具备多场景泛化能力,涵盖不同地形、天气和生物群系,并具备向非Minecraft游戏环境泛化的潜力。

为了系统性评估和比较交互式世界生成模型的性能,Matrix-Game提出了统一的GameWorld Score评测体系。该体系从视频的视觉质量、时序质量、动作可控性与物理规则理解四个维度全面量化模型性能,填补了该领域缺乏系统性评测基准的空白。在GameWorld Score评测系统中,Matrix-Game在视觉质量、时间一致性、动作可控性与物理规则理解四大维度上均取得领先成绩,全面超越现有开源基线模型Oasis与MineWorld。在双盲人评实验中,用户更倾向于选择Matrix-Game生成的视频,显示出其在交互式世界生成领域的卓越性能。

项目主页:

https://matrix-game-homepage.github.io

技术报告:

https://github.com/SkyworkAI/Matrix-Game/blob/main/assets/report.pdf

GitHub开源地址:

https://github.com/SkyworkAI/Matrix-Game

HuggingFace开源地址:

https://huggingface.co/Skywork/Matrix-Game

相关资讯

昆仑万维推出开源Matrix-Game大模型,推动游戏世界的智能生成

近日,昆仑万维正式宣布开源其最新的 Matrix-Game 大模型,这一模型以其超过10亿参数的规模,成为了工业界首个开源的空间智能大模型,标志着交互式世界生成技术的重大突破。 Matrix-Game 不仅支持知名游戏《我的世界》,还专为开放式环境中的高质量生成和精确控制而设计。 Matrix-Game 大模型的核心在于其三大组成部分。
5/13/2025 12:00:52 PM
AI在线

Nature子刊 | 光镜电镜通用,Meta「分割一切」模型用到显微镜图像上了

编辑丨coisini识别显微镜图像中的对象,例如光学显微镜(LM)下的细胞和细胞核是生物学图像分析中的关键任务之一。 由于显微镜成像方式的多样性和不同维度(二维 / 三维,时间维度)的存在,这些识别任务具有挑战性,目前需要采用不同的方法来解决。 基于深度学习的方法在过去几年中显著改善了 LM 下的细胞和细胞核分割,电子显微镜(EM)下的细胞、神经元和细胞器分割。
3/7/2025 1:14:00 PM
ScienceAI

OpenAI大秀肌肉,一口气放出10个新模型Demo,全球网友玩疯了

AI好好用报道编辑:杨文9.11和9.8哪个大还是答不对。9 月 13 日凌晨,OpenAI 又搞了个大新闻 ——推出 o1 系列模型,也就是江湖流传已久的「草莓」。这款模型到底厉害在哪,能让朋友圈刷了屏?这么说吧,它不需要专门训练,就能直接拿下数学奥赛金牌,甚至可以在博士级别的科学问答环节上超越人类专家。(查看详情,请移步:刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限)不过,实现通用复杂推理的代价是,每次回答要花费更长时间思考。因为 o1 是经过强化学习训练的新型语言模型,在输出回答之前,它会
9/14/2024 10:25:00 AM
AI好好用
  • 1