换装

中山大学联合字节智创数字人团队提出MMTryon虚拟试穿框架，效果优于现有SOTA

虚拟换装技术在特效以及电商的场景下有着广泛的应用，具有较高的商业潜质与价值。近期，中山大学联合字节跳动智能创作数字人团队提出了一种多模态多参考虚拟试穿 (VITON) 框架 MMTryon，可以通过输入多个服装图像及指定穿法的文本指令来生成高质量的组合试穿结果。对于单图换装，MMTryon有效的利用了大量的数据设计了一个表征能力强大的服装编码器, 使得该方案能处理复杂的换装场景及任意服装款式；对于组合换装，MMTryon消除了传统虚拟换装算法中对服装精细分割的依赖，可依靠一条文本指令从多张服装参考图像中选择需要试穿

7/8/2024 3:42:00 PM

新闻助手

资讯热榜

月之暗面 Kimi K2 发布并开源，擅长代码与 Agentic 任务 OpenAI 筹划进军硬件市场，CEO 奥尔特曼曾称 AI 革命不一定需要新硬件 ChatGPT 商业推荐被曝引用不可靠信息来源，专家提醒用户勿盲目信任谷歌 Gemini 待发布新技能曝光：AI 帮你生成插画故事书微软发布 Phi-4-mini-flash-reasoning 端侧 AI 模型：10 倍吞吐量，推理能力升级 ChatGPT 又遇“奶奶漏洞”，网友成功让 GPT-4o 主动生成“Win7 密钥” 多模态大模型的“安全锁”：SAPT 软提示调优技术资讯/神器/素材全都有！2025年6月设计素材周刊第四波

标签云

人工智能 AI OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌数据机器人大模型 Midjourney 用户开源智能 Meta 微软 GPT 学习图像技术 Gemini AI创作马斯克论文 Anthropic 代码英伟达算法 Stable Diffusion 智能体训练芯片开发者蛋白质生成式腾讯苹果 AI新词神经网络 3D Claude LLM 研究生成机器学习计算 AI for Science Sora 人形机器人 AI视频 xAI AI设计 GPU 华为百度搜索大语言模型 Agent 场景字节跳动预测大型语言模型深度学习伟达工具 Transformer 视觉 RAG 具身智能神器推荐亚马逊 Copilot 模态 AGI LLaMA 文本算力驾驶