AI在线 AI在线

腾讯宣布混元3D 2.1大模型对外开源

在计算机视觉领域顶会之一CVPR2025上,腾讯宣布混元3D2.1大模型对外开源,此为首个全链路开源的工业级3D生成大模型,在行业内处于领先地位。 混元3D模型在知名开源社区和技术平台Hugging Face的下载量已超180万,开源效果获全球开发者认可。 此次升级的混元3D2.1模型在效果上有显著提升,上传首饰盒图片后,生成的3D首饰盒纹理清晰、质感细腻、光影一致。

在计算机视觉领域顶会之一CVPR2025上,腾讯宣布混元3D2.1大模型对外开源,此为首个全链路开源的工业级3D生成大模型,在行业内处于领先地位。

混元3D模型在知名开源社区和技术平台Hugging Face的下载量已超180万,开源效果获全球开发者认可。此次升级的混元3D2.1模型在效果上有显著提升,上传首饰盒图片后,生成的3D首饰盒纹理清晰、质感细腻、光影一致。在游戏、电影、线上商城等领域,新模型可生成3D版角色、道具、产品模型。

微信截图_20250614095103.png

相较于混元3D2.0,新模型优化了几何生成质量,还开放了PBR材质生成大模型,提升3D资产质感和光影表现,告别“塑料感”。几何如同3D模型的“骨骼”,决定形态、轮廓与细节精度;纹理则是“皮肤”,还原表面颜色、光泽和细节。新模型优化细节建模,网格精度更高,拓扑一致性更好,为基础纹理映射提供基础,还能生成多种贴图,支持多种复杂材质的高质量渲染。

PBR技术通过模拟光线与材质的物理交互,提升模型在不同光照环境下的视觉一致性,在用户盲测中,混元3D2.1模型的PBR纹理质感胜出率高达78%。这种物理真实性既满足电影、游戏等高要求渲染场景需求,也为工业设计、虚拟仿真和数字孪生提供可靠3D资产,兼具美观与实用性。

除效果升级外,开发门槛也有所降低。混元3D2.1模型全链路开源,涵盖模型权重、训练代码以及数据处理流程,开发者可自由微调、二次训练或优化,满足定制化需求,也为学术研究提供平台。同时,该模型部署友好,适配消费级显卡,个人电脑也可运行,且在Github等开源地址提供详细部署和使用教程,助力企业、中小团队及个人开发者轻松上手。

开源网址:

https://3d-models.hunyuan.tencent.com/ 

体验网址:

https://3d.hunyuan.tencent.com/

相关资讯

告别平面!MIDI:可提取图片元素生成360度3D场景

还在对着二维照片里的美好场景望眼欲穿?梦想着能身临其境地漫步在那些迷人画面之中?现在,这个愿望有望成为现实!来自CVPR2025的重磅研究——MIDI(Multi-Instance Diffusion for Single Image to3D Scene Generation,多实例扩散单图到3D场景生成)横空出世,它就像一位技艺高超的魔法师,仅凭一张普通的2D图片,就能为你构建出一个栩栩如生的360度3D场景。 一图胜千言?现在还能“变”出整个世界!想象一下,你拍摄了一张阳光洒落的咖啡馆一角,照片里有精致的桌椅、香气四溢的咖啡杯,以及窗外婆娑的树影。 过去,这仅仅是一张静态的平面图像。
3/12/2025 9:35:00 AM
AI在线

告别Transformer!北大、北邮、华为开源纯卷积DiC:3x3卷积实现SOTA性能,比DiT快5倍!

当整个 AI 视觉生成领域都在 Transformer 架构上「卷生卷死」时,一项来自北大、北邮和华为的最新研究却反其道而行之,重新审视了深度学习中最基础、最经典的模块——3x3 卷积。 他们提出的 DiC (Diffusion CNN),一个纯卷积的扩散模型,不仅在性能上超越了广受欢迎的 Diffusion Transformer (DiT),更在推理速度上实现了惊人的提升。 这项工作证明了,经过精心设计,简单的卷积网络依然能在生成任务中登峰造极。
7/11/2025 4:37:00 PM
机器之心

抢疯了,腾讯给大模型人才,定了一个前所未有的标准

「21 世纪什么最贵?人才!」二十年前的黎叔语录,现在听来也不过时。这两年,大模型赛道风起云涌。科技公司们全力投入生成式 AI 技术的研发,期待将新的突破整合到自家产品中。OpenAI 是一个非常成功的样本,并受到了研究员、工程师和投资人们的广泛关注与深刻讨论:为什么是 OpenAI?它的成功不只来自于多年的坚持技术探索、投资者不断注入的资金,更重要的是一批顶尖 AI 研究人员的聚集。我们能看到,在 ChatGPT、Sora、GPT-4o 等划时代产品的背后,有一长串名单的核心贡献者,一家科技公司想要持续「伟大」,
6/21/2024 3:37:00 PM
机器之心
  • 1