AI在线 AI在线

阶跃星辰开源图像编辑模型 Step1X-Edit:身份一致性保持、区域级控制

该模型总参数量为 19B,具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持 11 类高频图像编辑任务类型,如文字替换、风格迁移、材质变换、人物修图等。

阶跃星辰今日宣布开源图像编辑大模型 Step1X-Edit,性能达到开源 SOTA。该模型总参数量为 19B(7B MLLM + 12B DiT),具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持 11 类高频图像编辑任务类型,如文字替换、风格迁移、材质变换、人物修图等。

AI在线附开源链接:

  • Github:https://github.com/stepfun-ai/Step1X-Edit

  • HuggingFace:https://huggingface.co/stepfun-ai/Step1X-Edit

  • ModelScope:https://www.modelscope.cn/models/stepfun-ai/Step1X-Edit/summary

  • 技术 Report:https://arxiv.org/pdf/2504.17761

阶跃星辰开源图像编辑模型 Step1X-Edit:身份一致性保持、区域级控制

官方表示,Step1X-Edit 针对自然语言图像编辑任务,具备以下核心能力:

  • 语义精准解析:支持自然语言描述的复杂组合指令,指令无需模板,能够灵活应对多轮、多任务编辑需求,同时支持对图像中文字进行识别、替换与重构;

  • 身份一致性保持:编辑后能稳定保留人脸、姿态与身份特征,适用于虚拟人、电商模特、社交图像等高一致性场景;

  • 高精度区域级控制:支持对指定区域进行文字、材质、色彩等定向编辑,保持图像风格统一,控制能力更精细。

阶跃星辰开源图像编辑模型 Step1X-Edit:身份一致性保持、区域级控制

相关资讯

Step1X-Edit:开源图像编辑新标杆 媲美GPT-4o等闭源模型

2025年4月27日,AIbase报道:由Stepfun AI团队推出的Step1X-Edit图像编辑模型于近日正式开源,引发业界广泛关注。 这一通用图像编辑框架以其卓越性能和实用的开源特性,展现了媲美GPT-4o和Gemini 2 Flash等闭源模型的潜力。 以下是对Step1X-Edit的全面解析,涵盖其技术亮点、应用场景及未来影响。
4/27/2025 9:00:49 AM
AI在线

阶跃星辰推出国内首个千亿参数端到端语音大模型“ Step-1o”

Step-1o 支持语音、文本等混合形式的输入和输出,可以快速反应并随时打断,它也能深度理解和模仿音色、韵律、方言、个性化的口语表达习惯等声音特征。
12/14/2024 5:44:41 PM
浩渺

大模型帮你写小说,阶跃星辰推出 Step-2“高性价比版”及“文学大师版”

阶跃星辰昨日上线了 Step-2 系列语言模型的两款新品 —— 参数量小、性价比更高的 Step-2 mini,以及专门针对内容创作领域推出的模型 Step 文学大师版。
1/21/2025 3:14:48 PM
浩渺
  • 1