AI在线 AI在线

小红书开源 InstanceAssemble:让 AI 精准还原复杂图像排版

AI在线 12 月 26 日消息,小红书携手复旦大学,联合推出布局控制生成(Layout-to-Image)领域的突破性方案 InstanceAssemble,通过创新“实例组装注意力”机制,实现了从简单到复杂、稀疏到密集布局的精准图像生成,相关成果已被 NeurIPS 2025 收录。 AI 绘画技术近年来快速发展,从最初的“文字生成图像”(Text-to-Image)逐步迈向“布局控制生成”(Layout-to-Image),后者会根据用户给定的空间布局约束(如边界框 Bounding Boxes、分割掩码 Masks 或骨架图)生成与之对应的图像。 “布局控制生成”技术的难点之一,就是如何让 AI 精确按照用户指定的位置和内容生成图像,面临布局对齐不准、语义脱节或计算成本过高的问题。

AI在线 12 月 26 日消息,小红书携手复旦大学,联合推出布局控制生成(Layout-to-Image)领域的突破性方案 InstanceAssemble,通过创新“实例组装注意力”机制,实现了从简单到复杂、稀疏到密集布局的精准图像生成,相关成果已被 NeurIPS 2025 收录。

小红书开源 InstanceAssemble:让 AI 精准还原复杂图像排版

AI 绘画技术近年来快速发展,从最初的“文字生成图像”(Text-to-Image)逐步迈向“布局控制生成”(Layout-to-Image),后者会根据用户给定的空间布局约束(如边界框 Bounding Boxes、分割掩码 Masks 或骨架图)生成与之对应的图像。

“布局控制生成”技术的难点之一,就是如何让 AI 精确按照用户指定的位置和内容生成图像,面临布局对齐不准、语义脱节或计算成本过高的问题。

而复旦大学与小红书联合发布的 InstanceAssemble 新技术,成功实现了对图像中每个物体的精准布局控制,标志着 AI 绘画进入“可精准构图”的新阶段。

小红书开源 InstanceAssemble:让 AI 精准还原复杂图像排版

该技术基于当前主流的扩散变换器架构,创新性地提出了“实例拼装注意力”机制。用户只需提供每个物体的边界框位置和内容描述,AI 就能在对应位置生成符合语义的图像内容。无论是简单的几个物体,还是密集复杂的场景,InstanceAssemble 都能保持高精度的布局对齐和语义一致性。

值得一提的是,该技术还采用轻量级适配方式降低使用门槛,无需重新训练整个模型,仅通过约 7100 万个参数(约 3.46% 额外参数),就能适配 Stable Diffusion3-Medium 模型,而适配 Flux.1 模型更是低至 0.84%。

实验中,InstanceAssemble 在包含 90 万个实例的密集布局数据集上表现优异,大幅超越了现有方法。

研究团队为能更准确地衡量布局与图像的匹配程度,还创建了包含 5000 张图像和 90000 个实例的“Denselayout”基准测试集,以及全新的“Layout Grounding Score”(LGS)评估指标。

实验表明,InstanceAssemble 在各种布局条件下均表现优异,即使在训练时仅使用稀疏布局(≤10 个实例)的情况下,也能在密集布局(≥10 个实例)上保持稳健性能。

这项技术已开源,代码和预训练模型可在 GitHub 获取,为设计、广告和内容创作等领域的应用提供了强大支持。

AI在线附上参考地址

  • 小红书开源 InstanceAssemble!轻量级布局可控生成框架,复杂多实例图像生成精度再突破

  • InstanceAssemble: Layout-Aware Image Generation via Instance Assembling Attention

  • InstanceAssemble GitHub

相关资讯

GPT-4o的P图全家桶有多强?连Midjourney CEO都坐不住了

GPT-4o的P图全家桶有多强?连Midjourney CEO都坐不住了

编辑 | 佳琪不会 PS 也能赢麻了! 这句话我们已经在各种各样的 AI 生图工具那里听了太多遍,不过,这次 GPT-4o 好像玩的是真的。 打开社交媒体,无论是 X 还是小红书,都被 GPT-4o 生成的图片刷了屏。
3/27/2025 6:54:00 PM AI好好用
小红书整治AI技术滥用,聚焦用AI起号引流带货、售卖AI账号

小红书整治AI技术滥用,聚焦用AI起号引流带货、售卖AI账号

小红书发布了关于整治AI技术滥用的治理公告,公告称,为维护清朗网络空间,营造积极健康、文明和谐的社区环境,小红书积极响应中央网信办、上海市委网信办关于“清朗·整治AI技术滥用”专项行动的要求,重点聚焦利用AI批量生产虚假内容涨粉、利用AI起号引流带货、售卖AI起号课程、售卖AI账号等违规行为开展专项整治工作,切实履行平台责任,深入清理违规问题。 针对“利用AI生成低俗猎奇视频”、“AI生成虚拟外国幼儿教育专家教授育儿内容”、“AI视频账号售卖教程”、“AI账号秘籍传授”、“引导规避平台AI标注”“转让、销售AI虚拟账号”等各类违规内容加强排查清理力度,共清理违规内容265条,对@IU干跨境等13个违规用户予以禁言处置。 同时严厉打击转让、售卖、出租网络账号行为,加强AI生成内容监测甄别。
5/12/2025 6:00:52 PM AI在线
Kimi与小红书联手,推出21天打卡挑战吸引用户

Kimi与小红书联手,推出21天打卡挑战吸引用户

近日,人工智能公司 Kimi 宣布与社交电商平台小红书达成市场营销合作,双方共同推出了一项名为 “21天打卡挑战” 的活动,旨在鼓励用户深入体验 Kimi 的核心功能。 小红书作为一个以年轻用户为主的社交平台,这次合作为 Kimi 提供了提升品牌认知的良机。 然而,在行业竞争愈发激烈的背景下,Kimi 面临着越来越大的商业化压力。
5/13/2025 9:00:52 AM AI在线