AI在线 AI在线

字节跳动发布图像编辑模型 SeedEdit 3.0,处理更加丝滑高效

它能够处理并生成 4K 图像,在精细且自然地处理编辑区域的同时,还能高保真地维持其他信息。

字节跳动 Seed 团队今日宣布发布图像编辑模型 SeedEdit 3.0,目前已经在即梦网页端开启测试,豆包 App 也即将上线。

字节跳动发布图像编辑模型 SeedEdit 3.0,处理更加丝滑高效

依靠 AI 完成指令式图像编辑的需求,广泛存在于视觉内容创意工作中。但此前,图像编辑模型在主体 & 背景保持、指令遵循等方面能力相对有限,导致编辑图像可用率不高。

据字节跳动官方介绍,SeedEdit 3.0 基于文生图模型 Seedream 3.0,叠加多样化的数据融合方法与特定奖励模型,较好地解决了上述难题。其图像主体、背景和细节保持能力进一步提升,尤其在人像编辑、背景更改、视角与光线转换等场景表现较为突出。

该模型可处理并生成 4K 图像,在精细且自然地处理编辑区域的同时,还能高保真地维持其他信息。尤其针对图像编辑“哪里改与哪里不改”的取舍,该模型表现出更佳的理解力和权衡力,可用率相应提高。当用户需要去掉图片内一众行人,模型不仅可以准确识别并移除场景内的无关人物,连影子也能一并去掉。

图片

▲ Prompt:移除中间人物以外的所有行人

在 2D 绘画转为真实模特的任务中,SeedEdit 3.0 较好地保持了人物的衣帽穿搭与手提包等细节,生成图片兼具时尚街拍感。

图片

Prompt:使女孩看起来逼真

整个场景的光影变换,模型也可以处理得丝滑、自然。从近处房屋,到远处海水波纹,细节均能合理保留下来,并跟随光线变化,进行“像素级”的渲染调整。

图片

Prompt:把场景变为白天

为了实现上述能力,团队在 SeedEdit 3.0 的研发工作中提出了一种高效的数据融合策略,并构建了种专用奖励模型

通过将这些奖励模型与扩散模型联合训练,团队针对性地改善了关键任务的编辑质量(如人脸对齐、文本渲染等)。实际落地中,我们也对推理加速进行了同步优化。

图片

Prompt:将“STOP”更改为“WARM”

字节跳动表示,除进一步优化编辑性能外,未来团队还将探索更丰富的编辑操作,让模型拥有连续多图生成、多张图像合成、故事性内容生成等能力。

AI在线附链接如下:

  • 项目主页:https://seed.bytedance.com/seededit

  • 技术报告:https://arxiv.org/ pdf/2506.05083

相关资讯

真·打字P图!字节发布新模型SeedEdit,一句话爆改世界名画,可免费体验

一句话实时P图,网友又能整活了。 字节豆包大模型又又又上新了! 11 月 11 日,字节跳动豆包大模型团队推出了最新图像编辑模型 SeedEdit,主打一句话轻松 P 图。
11/11/2024 1:26:00 PM
机器之心

一句话 P 图,字节跳动发布通用图像编辑模型 SeedEdit

用户只需输入简单的自然语言,便可对图像进行多样化编辑操作,包括修图、换装、美化、风格转化以及在指定区域添加或删除元素等。
11/12/2024 6:26:25 PM
沛霖(实习)

字节豆包通用图像编辑模型SeedEdit开启测试 用户可一句话轻松改图

11月11日,字节在豆包大模型团队官网上公布最新通用图像编辑模型SeedEdit。 SeedEdit支持一句话轻松改图,包括修图、换装、美化、转化风格、在指定区域添加删除元素等各类编辑操作,通过简单的自然语言即可驱动模型编辑任意图像。 目前,该模型已经在豆包PC端及即梦网页端开启测试。
11/11/2024 11:58:00 AM
新闻助手
  • 1