AI在线 AI在线

​苹果推出革命性 AI 模型 Matrix3D:轻松将 3 张照片转化为 3D 场景

苹果机器学习团队与南京大学和香港科技大学合作,推出了一款名为 Matrix3D 的先进 AI 模型。 该模型的主要功能是从少量的2D 照片中重建真实的物体和场景,为用户提供高质量的3D 输出。 用户只需提供三张照片,Matrix3D 便能自动生成详细的3D 重建效果。

苹果机器学习团队与南京大学和香港科技大学合作,推出了一款名为 Matrix3D 的先进 AI 模型。该模型的主要功能是从少量的2D 照片中重建真实的物体和场景,为用户提供高质量的3D 输出。

image.png

用户只需提供三张照片,Matrix3D 便能自动生成详细的3D 重建效果。这一过程不仅简化了3D 建模的操作步骤,也为各类应用领域带来了新的机遇,同时推动了 AI 技术的进一步发展。

在传统的3D 建模中,通常需要使用摄影测量技术,通过多张照片进行测量和建模。然而,目前的流程往往依赖于多个独立模型,例如姿态估计和深度预测,这种分散的方法容易导致效率低下和误差。Matrix3D 则改变了这一传统做法,它将图像、相机参数(如拍摄角度和焦距)以及深度数据等所有环节统一整合,采用一个统一的架构来处理这些信息,减少了中间步骤,从而使得重建过程更加顺畅可靠。研究人员指出,这种整合设计显著降低了人为错误的风险,并提高了整体性能。

在训练方法上,Matrix3D 运用了掩码学习策略,灵感来源于早期的 Transformer 基础 AI 系统。这种技术通过随机隐藏部分输入数据,促使模型学习如何 “填补空白”,增强了其适应性。即使在数据集较小或不完整的情况下,Matrix3D 也能够有效学习关键特征。

测试结果显示,Matrix3D 的表现非常出色。用户只需输入三张照片,该模型便可生成精细的3D 重建效果,涵盖物体和整个环境。这为沉浸式技术的应用提供了实质性的潜力。例如,在 Apple Vision Pro 等头显设备中,Matrix3D 能够创建真实感十足的虚拟场景,从而提升用户体验。研究者认为,这种能力将进一步推动元宇宙和增强现实的发展。

官方介绍:https://machinelearning.apple.com/research/large-photogrammetry-model

划重点:

🌟 Matrix3D 是苹果与南京大学、香港科技大学合作推出的 AI 模型,能从少量2D 照片中生成3D 场景。  

📸 用户只需提供三张照片,便可获得高质量的3D 重建,简化了操作流程。  

🚀 Matrix3D 整合了多个处理步骤,提高了效率并减少了人为错误,推动了 AI 技术的进一步发展。

相关资讯

太猛了!Nano Banana Pro 顶级邪修玩法超全总结!

来了朋友们,之前试了一下传说中的 Nano Banana Pro 模型,发现很厉害。 现在谷歌正式发布了,藏师傅第一时间上手探索了一下。 发现这玩意太 diao 了,直接把图片模型的能力推向了顶峰,尤其是支持中文,这个对我们来说太重要了。
11/24/2025 12:11:47 AM
歸藏

谷歌 Google Photos 照片应用将为 Magic Editor“AI 修图”功能引入 SynthID 隐藏水印特性

谷歌此前为其 Google Photos 照片应用引入了一项基于 AI 的 Magic Editor 修图功能,允许用户在受支持的设备中使用提示词对照片中的细节进行修改。
2/7/2025 9:06:11 AM
漾仔

谷歌重启 AI 驱动的 “Ask Photos” 功能,提升搜索速度!

近日,谷歌宣布其 AI 驱动的 “Ask Photos” 搜索工具将重新开放访问,并对该功能进行了一系列改进。 在此之前,谷歌曾悄然暂停了该工具的推出,以便进一步优化用户体验。 “Ask Photos” 工具由谷歌的 Gemini AI 模型提供支持,用户可以通过提出复杂的问题来快速找到所需的照片。
6/27/2025 12:00:42 PM
AI在线