阿里云开源通义千问图像编辑模型 Qwen-Image-Edit-2511！修复“图像漂移”问题，编辑一致性显著提升

作者：AI在线 2025-12-26 09:56

阿里云持续加码AIGC开源生态。今日，通义实验室正式开源其最新图像编辑模型——Qwen-Image-Edit-2511，重点解决前代版本（2509）中存在的图像编辑后“轻微漂移”问题（即编辑区域人物或物体位置发生偏移），通过多项技术优化，显著提升编辑前后的一致性与视觉稳定性，为开发者提供更可靠、精准的可控生成工具。直击痛点：告别“越修越歪”的编辑体验在早期版本Qwen-Image-Edit- 2509 中，用户反馈在进行局部修改（如更换服装、调整发型、替换背景）时，目标对象常出现微妙但明显的位移或形变，破坏图像整体协调性。

直击痛点：告别“越修越歪”的编辑体验

在早期版本Qwen-Image-Edit- 2509 中，用户反馈在进行局部修改（如更换服装、调整发型、替换背景）时，目标对象常出现微妙但明显的位移或形变，破坏图像整体协调性。Qwen-Image-Edit- 2511 针对性强化了空间对齐机制与结构保持能力，确保编辑仅作用于指定区域，其余部分“纹丝不动”，实现“所想即所得”的精准控制。

技术升级：一致性为核心，兼顾生成质量

新版本在以下方面实现关键增强：

- 结构一致性优化：引入改进的参考注意力机制，强化原始图像几何结构约束；

- 细节保真度提升：在像素级修复中保留纹理、光照与边缘锐度；

- 指令-图像对齐增强：更准确理解复杂编辑指令（如“给女士戴上红色贝雷帽，帽子位置自然”）。

开源即赋能，推动AIGC工具链成熟

Qwen-Image-Edit- 2511 已开放模型权重与推理代码，支持通过文本指令或掩码图进行编辑，可广泛应用于电商换装、影视后期、设计原型迭代、社交媒体修图等场景。开发者可基于该模型快速构建高精度图像编辑应用，无需从零训练。

AIbase认为，图像编辑模型的“微米级”精度提升，正是AIGC从“能用”迈向“好用”的关键一步。当AI不再“手抖”，创作者才能真正信任它作为数字画笔。阿里云此次快速迭代并开源修复版，不仅体现其技术响应速度，更彰显中国大模型厂商在垂直能力深耕与社区共建上的持续投入——AIGC的下一程，属于那些能解决真实世界“小问题”的大模型。

原来，这些顶级大模型都是蒸馏的

「除了 Claude、豆包和 Gemini 之外，知名的闭源和开源 LLM 通常表现出很高的蒸馏度。」这是中国科学院深圳先进技术研究院、北大、零一万物等机构的研究者在一篇新论文中得出的结论。前段时间，一位海外技术分析师在一篇博客中提出了一个猜想：一些顶级的 AI 科技公司可能已经构建出了非常智能的模型，比如 OpenAI 可能构建出了 GPT-5，Claude 构建出了 Opus 3.5。

1/29/2025 6:40:00 PM 机器之心

全球开源大模型榜单揭晓，阿里通义千问独占鳌头

近日，全球最大人工智能开源社区 Huggingface 发布了最新的开源大模型排行榜（Open LLM Leaderboard），结果显示，排名前十的开源大模型全都是基于阿里通义千问(Qwen)开源模型进行二次训练的衍生模型。这一成就标志着 Qwen 在开源 AI 领域的主导地位，进一步推动了其在全球的影响力。 Open LLM Leaderboard 被广泛认为是当前最权威的开源大模型榜单，测试维度涵盖了多个领域，包括阅读理解、逻辑推理、数学计算及事实问答等。

2/11/2025 11:55:00 AM AI在线

IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线

IBM 近日宣布，其 AI 开发平台 watsonx.ai 现已支持 DeepSeek-R1蒸馏版的 Llama3.18B和 Llama3.370B模型。 DeepSeek 通过知识蒸馏技术，利用 R1模型生成的数据对多个 Llama和 Qwen变体进行了优化，进一步提升了模型性能。在 watsonx.ai平台上，用户可以通过两种方式使用 DeepSeek 蒸馏模型。

2/11/2025 2:25:00 PM AI在线

阿里云开源通义千问图像编辑模型 Qwen-Image-Edit-2511！修复“图像漂移”问题，编辑一致性显著提升

相关资讯

原来，这些顶级大模型都是蒸馏的

全球开源大模型榜单揭晓，阿里通义千问独占鳌头

IBM 强化 watsonx.ai:DeepSeek-R1蒸馏版 Llama 模型上线