3D

UC伯克利5千美元造全开源人形机器人，网友：这作业抄定了

仅需5000美元就能实现人形机器人3D打印？ UC伯克利这次又又又整新活了！注意看，画面中这个正在认真写名字的小家伙，就是来自UC伯克利的最新作品——人形机器人Berkeley Humanoid Lite （BHL）。

5/21/2025 8:53:00 AM

参数量暴降，精度反升！哈工大宾大联手打造点云分析新SOTA

新架构选择用KAN做3D感知，点云分析有了新SOTA！来自哈尔滨工业大学（深圳）和宾夕法尼亚大学的联合团队最近推出了一种基于Kolmogorov-Arnold Networks(KANs)的3D感知解决方案——PointKAN，在处理点云数据的下游任务上展现出巨大的潜力。 △PointKAN与同类产品的比较替代传统的MLP方案，PointKAN具有更强的学习复杂几何特征的能力。

5/19/2025 2:56:45 PM

新一代开源3D模型 Step1X-3D 亮相，AI行业新动向引关注

近日，科技领域迎来了一款全新的开源3D 大模型 —— 阶跃星辰 Step1X-3D。该模型的发布，标志着 AI 技术的又一次重大进步，尤其是在3D 建模和推理能力方面。该模型不仅开源，且针对开发者提供了多种实用的功能，极大地促进了创新和研究的可能性。

5/15/2025 11:02:25 AM

AI在线

The Next Generation Open Source 3D Model Step1X-3D Debuts, AI Industry Trend Draws Attention

Recently, the technology sector welcomed a brand-new open-source 3D large model called "Step1X-3D." The release of this model marks another significant advancement in AI technology, particularly in 3D modeling and reasoning capabilities. Not only is this model open-source, but it also provides developers with various practical features, greatly promoting innovation and research possibilities.At the same time, Xiaomi is continuously expanding its presence in the AI field. It has recently applied for the "MiMo" trademark, which is intended to be used for inference large models.

5/15/2025 10:01:53 AM

AI在线

阶跃星辰开源 3D 大模型 Step1X-3D

阶跃星辰正式发布并开源了3D大模型Step1X-3D。这一模型的推出，标志着阶跃星辰在多模态方向上的最新成果，继图像、视频、语音、音乐等模态后，进一步拓展了AI技术的应用边界。 Step1X-3D模型总参数量达4.8B，其中几何模块1.3B，纹理模块3.5B。

5/14/2025 5:00:52 PM

AI在线

3D人脸黑科技！Pixel3DMM：单张RGB图像秒变3D人脸，姿势表情精准还原，几何精度碾压竞品15%！

慕尼黑工业大学和伦敦大学学院提出了一款经过微调的 DINO ViT模型 Pixel3DMM，用于逐像素表面法线和 UV 坐标预测。从上到下，下图展示了 FFHQ 输入图像、估计的表面法线、根据预测的 UV 坐标估计的二维顶点，以及针对上述两个线索的 FLAME 拟合结果。使用Pixel3DMM 进行野外追踪。

5/14/2025 9:23:55 AM

苹果推出革命性 AI 模型 Matrix3D：轻松将 3 张照片转化为 3D 场景

苹果机器学习团队与南京大学和香港科技大学合作，推出了一款名为 Matrix3D 的先进 AI 模型。该模型的主要功能是从少量的2D 照片中重建真实的物体和场景，为用户提供高质量的3D 输出。用户只需提供三张照片，Matrix3D 便能自动生成详细的3D 重建效果。

5/14/2025 9:01:02 AM

AI在线

腾讯发布全新 AI 框架 PrimitiveAnything：颠覆 3D 形状生成方式！

在计算机视觉和图形学中，3D 形状的抽象是一个基础且关键的研究领域。通过将复杂的3D 形状分解为简单的几何单位，研究者能够更好地理解人类视觉感知的机制。然而，现有的3D 生成方法通常无法满足机器人操作或场景理解等任务对语义深度和可解释性的要求。

5/12/2025 10:01:16 AM

AI在线

CVPR 2025 Highlight | 清华提出一键式视频扩散模型VideoScene，从视频到 3D 的桥梁，一步到位！

清华大学的研究团队首次提出了一种一步式视频扩散技术 VideoScene，专注于 3D 场景视频生成。它利用了 3D-aware leap flow distillation 策略，通过跳跃式跨越冗余降噪步骤，极大地加速了推理过程，同时结合动态降噪策略，实现了对 3D 先验信息的充分利用，从而在保证高质量的同时大幅提升生成效率。实验证明VideoScene可弥合从视频到 3D 的差距。

5/12/2025 9:31:44 AM

南洋理工 & 牛津 & 新加坡理工提出Amodal3R，可从遮挡 2D 图像重建完整 3D 资产，3D生成也卷起来了！

Amodal3R 是一种条件式 3D 生成模型，能够从部分可见的 2D 物体图像中推测并重建完整的 3D 形态和外观，显著提升遮挡场景下的 3D 重建质量。给定图像中部分可见的物体，Amodal3R 重建具有合理几何形状和合理外观的语义上有意义的 3D 资产。相关链接论文：：：即将开放...模型：：的示例结果。

5/7/2025 10:09:49 AM

AIGC Studio

细节直逼亚毫米级！港科广分层建模突破3D人体生成｜CVPR 2025

从人体单图变身高保真3D模型，不知道伤害了多少程序猿头发的行业难题，竟然被港科广团队一招破解了！团队最新提出的MultiGO创新方案，借助分层建模思路——将人体分解为不同精度层级，从基础体型到衣物褶皱逐级细化。这有点像在搭乐高积木：先大模块构建整体轮廓，再用小零件补充细节，最后再处理材质纹理。

5/6/2025 8:50:00 AM

谷歌DeepMind Genie 2亮相《60 Minutes》，革新3D交互环境生成技术

CBS著名栏目《60Minutes》深入报道了谷歌DeepMind人工智能研究实验室的最新突破，重点聚焦其全新AI模型——Genie2。据AIbase了解，Genie2能够从单一图像或简单文本描述生成高度逼真的3D交互式环境，为机器人训练、虚拟世界构建及通用人工智能（AGI）发展开辟了新路径。社交平台上的热烈讨论凸显了其技术革新性，相关细节已通过DeepMind官网(deepmind.google)与Hugging Face公开。

4/30/2025 10:00:55 AM

AI在线

扩散模型还原被遮挡物体，几张稀疏照片也能"脑补"完整重建交互式3D场景｜CVPR'25

你是否设想过，仅凭几张随手拍摄的照片，就能重建出一个完整、细节丰富且可自由交互的3D场景？在传统方法中，这几乎是不可能完成的任务，稀少的拍摄视角往往导致模型无法还原被遮挡的区域，生成的场景要么残缺不全，要么细节模糊。更令人困扰的是，传统的重建算法无法解耦场景中的独立物体，重建结果无法交互，严重限制了在具身智能、元宇宙和影视游戏等领域的应用前景。

4/24/2025 9:38:00 AM

从Minecraft到虚幻5，AI首次实现3D游戏零样本迁移，跨游戏直接上手

该研究成果由北京大学和加州大学洛杉矶分校共同完成。第一作者蔡少斐为北京大学三年级博士生，通讯作者为北京大学助理教授梁一韬。该工作基于 MineStudio 开源项目，一个全流程简化版 Minecraft AI Agent 开发包，相关代码均已在 GitHub 上开源。

4/23/2025 9:28:58 AM

机器之心

3D高斯泼溅算法大漏洞：数据投毒让GPU显存暴涨70GB，甚至服务器宕机

随着3D Gaussian Splatting（3DGS）成为新一代高效三维建模技术，它的自适应特性却悄然埋下了安全隐患。在本篇 ICLR 2025 Spotlight 论文中，研究者们提出首个专门针对3DGS的攻击方法——Poison-Splat，通过对输入图像加入扰动，即可显著拖慢训练速度、暴涨显存占用，甚至导致系统宕机。这一攻击不仅隐蔽、可迁移，还在现实平台中具备可行性，揭示了当前主流3D重建系统中一个未被重视的安全盲区。

4/23/2025 8:50:00 AM

量子位