AI在线 AI在线

图像生成模型

通义千问推出 Qwen-Image-Layered 模型,实现图片 “分层编辑” 突破

通义千问推出 Qwen-Image-Layered 模型,实现图片 “分层编辑” 突破

今日,通义千问团队正式发布全新图像生成模型 Qwen-Image-Layered,该模型以自研创新架构打破传统 AI 图片编辑局限,通过 “图层拆解” 技术赋予静态图片可编辑性,开启 “指哪改哪” 的精准编辑新时代。 当前 AI 图片编辑存在两大痛点:全局编辑易破坏未修改区域一致性,基于掩码的局部编辑难处理遮挡与模糊边界。 Qwen-Image-Layered 则创新提出 “图像解耦” 思路,将图片自动 “剥洋葱” 式分解为语义独立的 RGBA 图层,每层拥有专属颜色(RGB)与透明度(Alpha),可独立操作且不影响其他图层。
12/22/2025 5:26:21 PM AI在线
OpenAI 推出全新图像生成模型 GPT Image 1.5,性能显著提升!

OpenAI 推出全新图像生成模型 GPT Image 1.5,性能显著提升!

OpenAI 于正式发布了其最新的图像生成模型 GPT Image1.5,标志着 ChatGPT 在视觉创作能力上的重大突破。 这一新模型不仅能够生成高保真的图像,还在理解用户指令方面表现优异,具备极强的提示词遵循能力。 新版本的 GPT Image1.5能够从零开始创作图像,或者在用户上传的照片基础上进行编辑,同时保留原图的核心要素,准确执行用户的各种指令。
12/17/2025 8:51:27 AM AI在线
腾讯开源 X-Omni:RL缝合混合架构,对标 GPT-4o,中文文本渲染登顶

腾讯开源 X-Omni:RL缝合混合架构,对标 GPT-4o,中文文本渲染登顶

近日,腾讯研究团队打造了一款新型图像生成模型X-Omni。 技术上,采用了强化学习重构混合模型架构;性能上,直接对标OpenAI的GPT-4o。 地址:,还在多个图像生成任务中击败了商用大模型。
8/20/2025 12:00:00 AM
Recraft 完成 3000 万美元 B 轮融资,其图像生成模型曾击败 DALL-E 和 Midjourney

Recraft 完成 3000 万美元 B 轮融资,其图像生成模型曾击败 DALL-E 和 Midjourney

初创公司Recraft宣布完成3000万美元B轮融资,其图像生成模型“red_panda”在基准测试中超越DALL-E和Midjourney,成为行业焦点。该模型在品牌图像生成方面表现突出,精准放置品牌标识,无需额外编辑。#AI图像生成##Recraft融资#
5/6/2025 5:42:18 PM 远洋
Ideogram 正式发布 3.0 版本模型:真实感与创意表现再突破

Ideogram 正式发布 3.0 版本模型:真实感与创意表现再突破

Ideogram 官方宣布推出其最新图像生成模型——Ideogram3.0。 这一版本在真实感、创意表现力和风格一致性上实现了显著突破,被认为是图像生成领域的一次重要里程碑。 新模型不仅对标 GPT-4o 等顶级 AI 系统,还以其高效性能和创新功能吸引了广泛关注。
3/27/2025 9:53:00 AM AI在线
谷歌推出Imagen 3 API,价格0.03美元/张

谷歌推出Imagen 3 API,价格0.03美元/张

近日,谷歌正式推出其最新的图像生成模型 ——Imagen3,现已在 Gemini API 上可供开发者使用。 该模型在视觉效果上表现出色,能够生成各种风格的高质量图像,包括超现实主义作品、印象派风景、抽象作品以及动漫角色。 Imagen3不仅提升了图像的清晰度和构图能力,还通过简化的文本提示,帮助用户更轻松地将创意转化为图像。
2/8/2025 11:10:00 AM AI在线