AI在线 AI在线

腾讯宣布混元3D 2.1大模型对外开源

在计算机视觉领域顶会之一CVPR2025上,腾讯宣布混元3D2.1大模型对外开源,此为首个全链路开源的工业级3D生成大模型,在行业内处于领先地位。 混元3D模型在知名开源社区和技术平台Hugging Face的下载量已超180万,开源效果获全球开发者认可。 此次升级的混元3D2.1模型在效果上有显著提升,上传首饰盒图片后,生成的3D首饰盒纹理清晰、质感细腻、光影一致。

在计算机视觉领域顶会之一CVPR2025上,腾讯宣布混元3D2.1大模型对外开源,此为首个全链路开源的工业级3D生成大模型,在行业内处于领先地位。

混元3D模型在知名开源社区和技术平台Hugging Face的下载量已超180万,开源效果获全球开发者认可。此次升级的混元3D2.1模型在效果上有显著提升,上传首饰盒图片后,生成的3D首饰盒纹理清晰、质感细腻、光影一致。在游戏、电影、线上商城等领域,新模型可生成3D版角色、道具、产品模型。

微信截图_20250614095103.png

相较于混元3D2.0,新模型优化了几何生成质量,还开放了PBR材质生成大模型,提升3D资产质感和光影表现,告别“塑料感”。几何如同3D模型的“骨骼”,决定形态、轮廓与细节精度;纹理则是“皮肤”,还原表面颜色、光泽和细节。新模型优化细节建模,网格精度更高,拓扑一致性更好,为基础纹理映射提供基础,还能生成多种贴图,支持多种复杂材质的高质量渲染。

PBR技术通过模拟光线与材质的物理交互,提升模型在不同光照环境下的视觉一致性,在用户盲测中,混元3D2.1模型的PBR纹理质感胜出率高达78%。这种物理真实性既满足电影、游戏等高要求渲染场景需求,也为工业设计、虚拟仿真和数字孪生提供可靠3D资产,兼具美观与实用性。

除效果升级外,开发门槛也有所降低。混元3D2.1模型全链路开源,涵盖模型权重、训练代码以及数据处理流程,开发者可自由微调、二次训练或优化,满足定制化需求,也为学术研究提供平台。同时,该模型部署友好,适配消费级显卡,个人电脑也可运行,且在Github等开源地址提供详细部署和使用教程,助力企业、中小团队及个人开发者轻松上手。

开源网址:

https://3d-models.hunyuan.tencent.com/ 

体验网址:

https://3d.hunyuan.tencent.com/

相关资讯

告别平面!MIDI:可提取图片元素生成360度3D场景

还在对着二维照片里的美好场景望眼欲穿?梦想着能身临其境地漫步在那些迷人画面之中?现在,这个愿望有望成为现实!来自CVPR2025的重磅研究——MIDI(Multi-Instance Diffusion for Single Image to3D Scene Generation,多实例扩散单图到3D场景生成)横空出世,它就像一位技艺高超的魔法师,仅凭一张普通的2D图片,就能为你构建出一个栩栩如生的360度3D场景。 一图胜千言?现在还能“变”出整个世界!想象一下,你拍摄了一张阳光洒落的咖啡馆一角,照片里有精致的桌椅、香气四溢的咖啡杯,以及窗外婆娑的树影。 过去,这仅仅是一张静态的平面图像。
3/12/2025 9:35:00 AM
AI在线

抢疯了,腾讯给大模型人才,定了一个前所未有的标准

「21 世纪什么最贵?人才!」二十年前的黎叔语录,现在听来也不过时。这两年,大模型赛道风起云涌。科技公司们全力投入生成式 AI 技术的研发,期待将新的突破整合到自家产品中。OpenAI 是一个非常成功的样本,并受到了研究员、工程师和投资人们的广泛关注与深刻讨论:为什么是 OpenAI?它的成功不只来自于多年的坚持技术探索、投资者不断注入的资金,更重要的是一批顶尖 AI 研究人员的聚集。我们能看到,在 ChatGPT、Sora、GPT-4o 等划时代产品的背后,有一长串名单的核心贡献者,一家科技公司想要持续「伟大」,
6/21/2024 3:37:00 PM
机器之心

300倍体积缩减!​Hugging Face推SmolVLM模型:小巧智能,手机也能跑AI

Hugging Face 推出了一款令人瞩目的 AI 模型 ——SmolVLM。 这款视觉语言模型的体积小到可以在手机等小型设备上运行,且性能超越了那些需要大型数据中心支持的前辈模型。 SmolVLM-256M 模型的 GPU 内存需求不足1GB,性能却超过了其前代 Idefics80B 模型,这一后者的规模是其300倍,标志着实用 AI 部署的一个重大进展。
1/24/2025 9:48:00 AM
AI在线
  • 1