首页 > 快讯 > 探索小红书InstanceAssemble：一款轻便可控的布局生成工具，革新复杂多实例图像生成的精准度

探索小红书InstanceAssemble：一款轻便可控的布局生成工具，革新复杂多实例图像生成的精准度

发布时间：2025-12-26 09:04:24 | 责任编辑：吴昊 | 浏览量：143 次

在AIGC从“自由创作”迈向“精准控制”的关键阶段，小红书AIGC团队今日开源其全新布局可控图像生成框架——InstanceAssemble，专为解决高密度、多对象、复杂空间关系的Layout-to-Image任务而设计。该框架在保持极低参数增量（最低仅0.84%）的前提下，显著提升生成图像的空间对齐精度与语义一致性，为电商、设计、游戏等高要求场景提供工业级解决方案。
级联建模 + Assemble-Attention，破解“多物堆叠”难题
传统Layout-to-Image模型在面对“10个商品图标+文字标签+背景图层”等复杂布局时，常出现对象错位、重叠或语义错配。InstanceAssemble创新性采用级联双阶段架构:
1. 语义理解阶段:解析文本描述与布局指令的语义关联;
2. 空间组装阶段:通过自研Assemble-Attention机制，动态建模实例间相对位置、遮挡关系与层次结构，确保每个元素“该在哪，就在哪”。
实验显示，在密集商品展示、多角色插画、UI界面生成等场景中，InstanceAssemble的对象定位准确率与边缘清晰度显著优于现有方法。
极轻量适配，兼容主流底模
为降低部署门槛，框架采用超轻量LoRA适配器:
- 适配Stable Diffusion3-Medium仅需3.46%额外参数;
- 适配Flux.1模型更是低至0.84%。
这意味着用户无需重新训练大模型，即可在保留底模强大生成能力的同时，灵活注入布局控制能力，支持文本+参考图+边界框的多模态指令。
自建DenseLayout基准，推动评估标准化
为精准衡量布局对齐质量，小红书同步发布DenseLayout评测数据集与LGS（Layout Grounding Score）可解释指标。LGS从位置精度、尺度匹配、语义一致性三个维度量化生成效果，解决传统指标(如IoU)在密集场景下失真的问题。
小编认为，InstanceAssemble的发布，标志着AIGC正从“画得像”走向“摆得准”。当AI不仅能生成精美图像，还能按设计师的精确布局指令“摆放”每个元素，AIGC才真正具备嵌入专业生产流程的能力。而小红书此次开源，不仅赋能社区创作者，更将推动整个行业向可控、可靠、可商用的生成式AI迈进。
论文链接:https://arxiv.org/abs/2509.16691
项目主页:https://github.com/FireRedTeam/InstanceAssemble

这是一篇关于小红书开源InstanceAssemble！轻量级布局可控生成框架，复杂多实例图像生成精度再突破的文章，内容值得关注。

©️版权声明：
本网站(https://aigc.izzi.cn)刊载的所有内容，包括文字、图片、音频、视频等均在网上搜集。
访问者可将本网站提供的内容或服务用于个人学习、研究或欣赏，以及其他非商业性或非盈利性用途，但同时应遵守著作权法及其他相关法律的规定，不得侵犯本网站及相关权利人的合法权利。除此以外，将本网站任何内容或服务用于其他用途时，须征得本网站及相关权利人的书面许可，并支付报酬。
本网站内容原作者如不愿意在本网站刊登内容，请及时通知本站，予以删除。

上一篇： DeepSeek 和元宝的 “连接” 行动！我们的生活正日渐>Welcome AI助手

下一篇：科技巨头间的AI人才角逐升温：OpenAI与谷歌为实习生提供超高薪资待遇

探索小红书InstanceAssemble：一款轻便可控的布局生成工具，革新复杂多实例图像生成的精准度

最新Ai信息

最新Ai工具

热门AI推荐