AI在线 AI在线

谷歌黑科技炸场!LightLab:只需一张图+AI,光影编辑像呼吸一样简单,废片秒变电影级大片!

在之前的文章中以及和大家介绍过需要关于图像&视频重打光的方法,在今天的推送文章中,已经帮大家重新整理好了,欢迎大家点击阅读~今天给大家介绍谷歌提出的一种基于扩散模型的方法LightLab,可以实现对单张图像中光源的细粒度、参数化控制。 该方法能够调整可见光源的强度和颜色、环境光照的强度,并可在场景中插入虚拟光源。 LightLab方法能够对图像中的光源进行显式的参数化控制,同时生成物理上合理的阴影和环境光效应。

在之前的文章中以及和大家介绍过需要关于图像&视频重打光的方法,在今天的推送文章中,已经帮大家重新整理好了,欢迎大家点击阅读~

图片

今天给大家介绍谷歌提出的一种基于扩散模型的方法LightLab,可以实现对单张图像中光源的细粒度、参数化控制。该方法能够调整可见光源的强度和颜色、环境光照的强度,并可在场景中插入虚拟光源。

LightLab方法能够对图像中的光源进行显式的参数化控制,同时生成物理上合理的阴影和环境光效应。此外还可以调节光源的强度、改变其颜色,以及调整环境光照。下图为 LightLab 的灯光编辑结果:

图片

相关链接

  • 论文:https://www.arxiv.org/pdf/2505.09608

论文介绍

图片

控制图像中的光源是摄影的一个基本方面,它影响图像中的主体、景深分离、色彩以及整体氛围。现有的重光照(relighting)方法要么依赖于多个输入视角在推理阶段进行逆向渲染,要么无法提供明确的光源控制。

谷歌提出了一种基于扩散模型的方法LightLab,实现对单张图像中光源的细粒度、参数化控制。LightLab方法能够调整可见光源的强度和颜色、环境光照的强度,并可在场景中插入虚拟光源。LightLab方法能够对图像中的光源进行显式的参数化控制,同时生成物理上合理的阴影和环境光效应。该方法可以调节光源的强度、改变其颜色,以及调整环境光照。

论文的主要贡献如下:

  • 一种有效地微调和调节扩散模型的方法,用于基于单幅图像对光源进行参数控制。
  • 论文证明了即使是少量真实的、物理上精确的训练样本,也能补充大规模合成渲染,其中前者可以防止域漂移,而后者可以提高物理合理性。
  • 由此产生的高质量基于图像的解决方案,使用户能够进行复杂且连续的照明编辑。

方法概述

图片后处理流程。

  • 上行:从一对真实(原始)照片对中,首先分离出目标光变化 ichange。
  • 下行:对于合成数据,分别渲染每个光分量。在光解缠结之后,两个域均经过光运算以创建参数化的图像序列 irelit (𝛼,𝛾, ct),然后将其色调映射到 SDR(可以一起进行,也可以单独进行)。

图片调节信号。

  • 空间条件(输入图像、目标光掩模和深度图)嵌入到潜在维度并与输入噪声连接。通过缩放目标光掩模的强度和颜色来应用光强度和颜色控制。
  • 全局控制(环境光强度和色调映射值)投影到文本嵌入维度,并通过交叉注意力机制插入。

色调映射策略。一系列光照强度递增的图像,色调映射可单独进行,也可同时进行。上行:图像单独进行色调映射,注意光源强度在点亮时如何保持恒定,而环境光则似乎变暗。下行:同时进行色调映射

色调映射策略。一系列光照强度递增的图像,色调映射可单独进行,也可同时进行。上行:图像单独进行色调映射,注意光源强度在点亮时如何保持恒定,而环境光则似乎变暗。下行:同时进行色调映射

强度控制。使用提出的方法对目标光的强度进行细粒度控制。数值表示相对于源图像的相对强度变化。

强度控制。使用提出的方法对目标光的强度进行细粒度控制。数值表示相对于源图像的相对强度变化。

颜色控制。打开输入图像(左上)中不同颜色的路灯。上行:人造光黑体温度。下行:任意非自然 RGB 颜色。

颜色控制。打开输入图像(左上)中不同颜色的路灯。上行:人造光黑体温度。下行:任意非自然 RGB 颜色。

实验结果

训练域的影响。在不同域上训练的模型的真值相似度指标。二值图像。表示完全打开或关闭光源的图像对。

训练域的影响。在不同域上训练的模型的真值相似度指标。二值图像。表示完全打开或关闭光源的图像对。与其他研究的比较。左侧是配对评估集上 PSNR 和 SSIM 的地面真实相似度。右侧是该方法的用户研究偏好率。方法在物理合理性和用户满意度方面均优于先前的结果。

与其他研究的比较。左侧是配对评估集上 PSNR 和 SSIM 的地面真实相似度。右侧是该方法的用户研究偏好率。方法在物理合理性和用户满意度方面均优于先前的结果。定性比较:将合成数据添加到训练数据集的效果。黄绿色:仅在混合模型中模拟屏幕的镜面反射。红色:混合模型为电缆生成了精细的硬阴影,该阴影与其形状相关,并与地面实况相似。定性比较:将合成数据添加到训练数据集的效果。黄绿色:仅在混合模型中模拟屏幕的镜面反射。红色:混合模型为电缆生成了精细的硬阴影,该阴影与其形状相关,并与地面实况相似。定性比较。与其他基于 IIW 数据集图像的研究进行比较。左图:输入图像,其中绿色/红色轮廓分别指定应打开/关闭的光源。定性比较。与其他基于 IIW 数据集图像的研究进行比较。左图:输入图像,其中绿色/红色轮廓分别指定应打开/关闭的光源。定性结果。选取公开来源图像的测试结果,展示论文方法成功的光照编辑(绿色框)和失败的光照编辑(红色框)。定性结果。选取公开来源图像的测试结果,展示论文方法成功的光照编辑(绿色框)和失败的光照编辑(红色框)。

结论

LightLab是一种基于扩散的细粒度控制图像中光源的方法。利用光的线性和合成的 3D 数据,作者创建了一个高质量的成对图像数据集,隐式地模拟了复杂且受控的光照变化。论文证明了通过使用基于物理的数据对扩散模型进行微调,可以在捕获后实现对光源的物理合理控制。此外,作者也证明了利用经典的计算摄影技术和基于物理的模拟来生成生成模型的训练数据,是基于物理的图像编辑的一个有前景的方向。

相关资讯

AI接管新闻界?全球首份全AI报纸问世!AI新闻摘要即将上线

一家意大利报纸《Il Foglio》高调宣布,出版了世界上第一份完全由AI制作的报纸。 AI包揽了写作、标题、引用……甚至讽刺手法。 《Il Foglio》的编辑Claudio Cerasa称,这次发行AI报纸,是一项为期一个月的新闻实验的重要部分,旨在全方位展示AI技术对工作方式以及日常生活的影响。
3/20/2025 9:10:00 AM
新智元

推出不到一个月,谷歌Gemini翻车了

机器之能报道编辑:Sia谷歌下架 Gemini 人物图像生成服务。三月前,谷歌 Gemini 轰轰烈烈亮相,被描述为谷歌“最大、最有能力和最通用”的 AI 系统,并补充说它具有复杂的推理和编码能力。2 月 8 日,谷歌聊天机器人 Bard 正式更名为 Gemini,以反映新聊天机器人的“使命”——提供对“最有能力的模型系列”的访问。结果,推出不到一个月,Gemini 就捅了个大篓子。用户使用人像生成服务时发现,让 Gemini 承认白人的存好像非常困难,AI 拒绝在图像中描绘白人,以至于生成不少违背基本事实(性别、
2/23/2024 6:20:00 PM
机器之能

谷歌发布 Pixel Studio 本地 AI 文生图应用:基于 Imagen 3 模型,2 秒内生成

谷歌公司在今天召开的 Pixel 9 系列手机发布会上,推出名为 Pixel Studio 的全新图像生成应用,并表示将预装在每台 Pixel 9 系列手机上。用户可以在 Pixel Studio 应用中输入提示词,要求其生成图片。谷歌 Pixel Studio 应用采用本地运行生成,基于谷歌自己的 Imagen 3 模型,主要生成艺术风格的图片,而写实风格的图片效果比较差。以生成下面这张小猫为例,生成时间不超过 2 秒。谷歌 Pixel Studio 应用依赖谷歌 Tensor G4 SoC 芯片来生成图片,如果
8/14/2024 2:44:16 AM
故渊
  • 1