图像编辑模型
阿里云开源通义千问图像编辑模型 Qwen-Image-Edit-2511!修复“图像漂移”问题,编辑一致性显著提升
阿里云持续加码AIGC开源生态。 今日,通义实验室正式开源其最新图像编辑模型——Qwen-Image-Edit-2511,重点解决前代版本(2509)中存在的图像编辑后“轻微漂移”问题(即编辑区域人物或物体位置发生偏移),通过多项技术优化,显著提升编辑前后的一致性与视觉稳定性,为开发者提供更可靠、精准的可控生成工具。 直击痛点:告别“越修越歪”的编辑体验在早期版本Qwen-Image-Edit- 2509 中,用户反馈在进行局部修改(如更换服装、调整发型、替换背景)时,目标对象常出现微妙但明显的位移或形变,破坏图像整体协调性。
阿里 Qwen 发布新一代图像编辑模型Qwen-Image-Edit-2511,人物一致性大幅提升
阿里巴巴旗下的Qwen团队近期在 AI 视觉领域再次发力,正式发布了全新升级的图像编辑模型 Qwen-Image-Edit-2511。 针对以往 AI 在修图时容易导致“人脸变形”或“身份丢失”的痛点,该模型实现了质的飞跃,能够确保在进行创意修改的同时,精准保留原图人物的面部特征。 根据Qwen官方在Hugging Face上公布的信息,这款模型是此前版本的重大迭代。
P图手残党有救了,豆包·图像编辑模型3.0上线,一个对话框搞定「增删改替」
最近,一个长相酷似韩国影星河正宇的博主,在 TikTok 上发视频吐槽:「老婆总是喜欢乱 P 我睡觉的照片,咋整? 」本以为是撒狗粮,没想到还真撞上了 P 图界的邪修大神。 她总能把千奇百怪的睡姿,恰到好处地融进各种场景,脑洞大得能随机笑死一个路人。
Black Forest震撼开源FLUX.1 Kontext [dev]:媲美GPT-4o的图像编辑
Black Forest Labs正式宣布,其全新图像编辑模型 FLUX.1Kontext [dev] 现已开源,引发了AI社区的广泛关注。 这一模型作为FLUX.1系列的最新成员,以其强大的图像编辑能力和高效性能被誉为可媲美GPT-4o的开源替代方案。 FLUX.1Kontext [dev] 基于12亿参数的流匹配变换器架构,专为图像编辑任务设计,支持消费级硬件运行,为创作者、开发者和研究人员提供了前所未有的灵活性。
阶跃星辰开源图像编辑模型 Step1X-Edit:身份一致性保持、区域级控制
该模型总参数量为 19B,具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持 11 类高频图像编辑任务类型,如文字替换、风格迁移、材质变换、人物修图等。
Step1X-Edit:开源图像编辑新标杆 媲美GPT-4o等闭源模型
2025年4月27日,AIbase报道:由Stepfun AI团队推出的Step1X-Edit图像编辑模型于近日正式开源,引发业界广泛关注。 这一通用图像编辑框架以其卓越性能和实用的开源特性,展现了媲美GPT-4o和Gemini 2 Flash等闭源模型的潜力。 以下是对Step1X-Edit的全面解析,涵盖其技术亮点、应用场景及未来影响。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉