InstanceAssemble

小红书联合复旦开源 InstanceAssemble：实现 AI 图像精准排版控制

小红书联合复旦开源 InstanceAssemble：实现 AI 图像精准排版控制

近日，小红书与复旦大学联合发布了在布局控制生成（Layout-to-Image）领域的最新研究成果——InstanceAssemble。这项技术旨在解决 AI 绘画中长期存在的“构图难”问题，通过创新的机制实现了从简单到复杂场景的精准图像生成。据悉，相关论文已被人工智能顶级会议 NeurIPS2025收录。

12/26/2025 2:01:20 PM AI在线

小红书开源InstanceAssemble！轻量级布局可控生成框架，复杂多实例图像生成精度再突破

小红书开源InstanceAssemble！轻量级布局可控生成框架，复杂多实例图像生成精度再突破

在AIGC从“自由创作”迈向“精准控制”的关键阶段，小红书AIGC团队今日开源其全新布局可控图像生成框架——InstanceAssemble，专为解决高密度、多对象、复杂空间关系的Layout-to-Image任务而设计。该框架在保持极低参数增量（最低仅0.84%）的前提下，显著提升生成图像的空间对齐精度与语义一致性，为电商、设计、游戏等高要求场景提供工业级解决方案。级联建模 Assemble-Attention，破解“多物堆叠”难题传统Layout-to-Image模型在面对“10个商品图标文字标签背景图层”等复杂布局时，常出现对象错位、重叠或语义错配。

12/26/2025 9:57:05 AM AI在线

NIPS2025｜小红书智创AIGC团队提出布局控制生成新算法InstanceAssemble

NIPS2025｜小红书智创AIGC团队提出布局控制生成新算法InstanceAssemble

当下的文本生成图像扩散模型取得了长足进展，为图像生成引入布局控制（Layout-to-Image, L2I）成为可能。然而，现有布局到图像生成方法在复杂场景下表现仍不理想：一方面，如何精确对齐给定布局并同时保持高画质是巨大挑战；另一方面，在扩散生成的逐步去噪过程中确保每个目标的位置与语义属性不偏离也极为困难。此外，布局控制往往需要支持多模态条件（如文本、参考图等信息），这进一步增加了技术复杂度。

11/3/2025 4:59:00 PM 机器之心

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画大模型 AI新词机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 英伟达马斯克 Anthropic 图像 AI创作训练 LLM 论文代码 AI for Science 苹果算法腾讯 Agent Claude 芯片 Stable Diffusion 具身智能 xAI 蛋白质开发者人形机器人生成式神经网络机器学习 AI视频 3D RAG 大语言模型 Sora 百度字节跳动研究 GPU 生成工具华为 AGI 计算大型语言模型 AI设计生成式AI 搜索视频生成亚马逊 AI模型 DeepMind 特斯拉场景深度学习 Transformer 架构 Copilot MCP 编程视觉