AI在线 AI在线

字节 & 清华大学提出 AnyDressing :通过潜在扩散模型实现可定制的多服装虚拟试穿。

今天的文章来自公众号粉丝投稿,清华大学联合字节提出了一项虚拟试穿新方法AnyDressing: 可以利用参考的服饰和文本prompt定制化人物,核心是解决多服饰组合搭配、文本响应以及服饰细节的问题。 • 可靠性: AnyDressing 适合各种场景和复杂的服装。 • 兼容性: AnyDressing 兼容 LoRA 以及 ControlNet 和 FaceID 等插件。

图片

今天的文章来自公众号粉丝投稿,清华大学联合字节提出了一项虚拟试穿新方法AnyDressing: 可以利用参考的服饰和文本prompt定制化人物,核心是解决多服饰组合搭配、文本响应以及服饰细节的问题。

  • • 可靠性: AnyDressing 适合各种场景和复杂的服装。
  • • 兼容性: AnyDressing 兼容 LoRA 以及 ControlNet 和 FaceID 等插件。

图片图片

相关链接

  • • Project page: https://crayon-shinchan.github.io/AnyDressing/
  • • Huggingface: https://huggingface.co/papers/2412.04146
  • • Code: https://github.com/Crayon-Shinchan/AnyDressing
  • • Paper: https://arxiv.org/abs/2412.04146

论文阅读

图片

AnyDressing:通过潜在扩散模型实现可定制的多服装虚拟穿衣

摘要

基于扩散模型的以服装为中心的文本和图像提示图像生成方面的最新进展令人印象深刻。然而,现有的方法缺乏对各种服装组合的支持,并且难以在忠实于文本提示的同时保留服装细节,从而限制了它们在不同场景中的表现。在本文中,我们专注于一项新任务,即多服装虚拟穿衣,并提出了一种新颖的AnyDressing方法,用于根据任意服装组合和任意个性化文本提示定制角色。AnyDressing包含两个主要网络,分别为GarmentsNet和DressingNet,分别用于提取详细的服装特征和生成定制图像。具体而言,我们在GarmentsNet中提出了一个高效且可扩展的模块,称为服装特定特征提取器,用于并行单独编码服装纹理。这种设计在确保网络效率的同时防止了服装混淆。同时,我们在DressingNet中设计了一种自适应的穿衣注意机制和一种新颖的实例级服装定位学习策略,以将多服装特征准确地注入到它们相应的区域。该方法有效地将多件服装的纹理线索整合到生成的图像中,并进一步增强了文本与图像的一致性。此外,我们引入了服装增强纹理学习策略来改善服装的细粒度纹理细节。得益于我们精心设计,AnyDressing 可以作为插件模块,轻松与任何社区控制扩展集成以用于扩散模型,从而提高合成图像的多样性和可控性。大量实验表明,AnyDressing 取得了最先进的成果。

它是如何工作的?

图片

AnyDressing给定N 件目标服装,定制穿着多件目标服装的角色。GarmentsNet 利用服装特定特征提取器 (GFE)模块从多件服装中提取细节特征。DressingNet 使用Dressing-Attention (DA)模块和实例级服装定位学习机制将这些特征集成在一起进行虚拟穿衣。此外,服装增强纹理学习 (GTL)策略进一步增强细节。

与最新技术的比较

图片

与最先进的单件服装和多件服装穿衣方法 进行定性比较。

各种虚拟试衣效果

逼真的场景

图片

风格化的场景

图片

AnyDressing + IPA 和 ControlNet

图片图片图片

AnyDressing + LoRA

图片图片图片

结论

本文介绍了由两个核心网络(GarmentsNet 和 DressingNet)组成的 AnyDressing,重点关注一项新任务,即多服装虚拟穿衣。 GarmentsNet 采用服装特定特征提取器模块,高效地并行编码多服装特征。DressingNet 使用 Dressing-Attention 模块和实例级服装定位学习机制将这些特征集成到虚拟穿衣中。此外,论文还设计了一种服装增强纹理学习策略,以进一步增强纹理细节。该方法可以与任何社区控制插件无缝集成。大量实验表明,AnyDressing 取得了最先进的成果。

相关资讯

AIGC时代已来,跨模态内容生成技术发展得怎么样了

最近一年里,AIGC 是人工智能领域里最火的词汇之一。
1/21/2023 10:39:00 AM
机器之心

图文实录|澜舟科技合伙人李京梅:基于预训练模型的 AIGC 技术与应用实践

在 AIGC 领域,人类应该持续提升创造力,不要停止,不要因为有了 AI 就不去创造了,而 AI 也将通过提升整个产业效率的方式来帮助人类更好地创造价值。
2/28/2023 2:50:00 PM
澜舟科技

京东推出“AI 全能服务包”,帮助商家免费生成图文、视频和直播

感谢京东日前宣布推出“AI 全能服务包”,各类 AI 工具免费生成图文、视频和直播,号称“帮助商家节省 50% 运营成本”。据介绍,京小智支持 7x24 小时自动接待,降低客服成本超 50%。“羚珑”工具可实现秒级免费生成图片,“京点点”支持秒级免费生成文案,支持 AI 生成视频。此外,京东还支持免费数字人“智能代播”,实现 24 小时不间断直播。IT之家注意到,2023 年乌镇峰会互联网企业家论坛上,京东集团 CEO 许冉表示:京东产业大模型 —— 言犀大模型,已经在消费导购、商家经营、客服售后、医疗问诊等多个供
3/11/2024 2:09:08 PM
浩渺
  • 1