AI在线 AI在线

1.7 秒实现高清大片快速复原,我国团队发布 HYPIR 图像复原大模型

AI在线 7 月 28 日消息,中国科学院深圳先进技术研究院数字所董超研究员团队今日发布了一项名为 HYPIR 的图像复原大模型,不仅比现有的图像复原技术快数十倍,更在高清分辨率、文字保真、理解能力、用户控制灵活性等方面展现出了优异性能。 传统方法中,基于预训练扩散模型的复原技术显著提升了图像复原效果,但存在计算复杂度高、推理速度慢、训练资源消耗大以及生成结果可控性不足等问题,成为了限制图像复原技术发展的瓶颈问题。 ▲ 1927 年第五届索尔维会议合影修复去年,董超团队提出了智能画质增强大模型 SUPIR,将低质量的图像恢复到接近原始状态的高清图像,修复多种退化类型的图像。

AI在线 7 月 28 日消息,中国科学院深圳先进技术研究院数字所董超研究员团队今日发布了一项名为 HYPIR 的图像复原大模型,不仅比现有的图像复原技术快数十倍,更在高清分辨率、文字保真、理解能力、用户控制灵活性等方面展现出了优异性能。

传统方法中,基于预训练扩散模型的复原技术显著提升了图像复原效果,但存在计算复杂度高、推理速度慢、训练资源消耗大以及生成结果可控性不足等问题,成为了限制图像复原技术发展的瓶颈问题。

1927 年第五届索尔维会议合影修复

▲ 1927 年第五届索尔维会议合影修复

去年,董超团队提出了智能画质增强大模型 SUPIR,将低质量的图像恢复到接近原始状态的高清图像,修复多种退化类型的图像。而此次图像大模型 HYPIR 作为升级版,舍弃了迭代式的扩散模型训练,改用单步的对抗生成模型训练方式,将原有的算法速度提升了数倍,同时采用更新的文生图基模型进一步提升算法效果,实现了 8K 级别的细节生成,在生成图像的稳定性和可控性方面远超 SUPIR 大模型

HYPIR 大模型修复图像效果展示

▲ HYPIR 大模型修复图像效果展示

“以往图像复原方法中往往包括扩散模型蒸馏、ControlNet 适配器或者多步推理过程。而 HYPIR 则不需要依赖这些步骤,使用方法更加简单。在训练和推理速度上较传统方法提升了一个数量级以上,且性能更优。”董超介绍,HYPIR 主要有两个创新点,一是使用预训练扩散模型初始化复原网络;二是从理论角度出发解释这一简单方法背后蕴含的深刻原理。

实验数据显示,在单张显卡(图像处理器)上,HYPIR 仅需 1.7 秒即可完成一张 1024x1024 分辨率图像的复原。相比现有的图像复原方法,研究人员提出的 HYPIR 在复原图像的质量上性能更优,且能够适用于各种尺寸的预训练扩散模型,为不同应用场景提供了灵活性。

HYPIR 大模型处理图片纹理细节的效果展示

▲ HYPIR 大模型处理图片纹理细节的效果展示

在应用层面,研究人员介绍,HYPIR 在图像高清分辨率、文字保真、理解能力、用户控制灵活性等方面均展现出了优异的性能。

例如,在老照片修复方面,研究人员运用 HYPIR 修复了国内外经典电影、电视剧老照片,让模糊的影像重现清晰的细节,为文化记忆传承提供了技术支持。在高分辨率图像修复领域,HYPIR 同样表现出色,因其兼具速度与效果,HYPIR 成功攻克了传统方法在生成 8K 分辨率图像时往往面临速度慢或效果不佳的难题。

HYPIR 大模型在高分辨率图像超分复原方面的效果展示

▲ HYPIR 大模型在高分辨率图像超分复原方面的效果展示

在文字保真方面,传统基于扩散模型的方法常导致复原出的文字模糊或扭曲,缺乏精确性,而 HYPIR 则能够使复原出的文字保持高保真度和清晰度,无论是简单的标识还是复杂的文档,HYPIR 都能精准地还原其原始形态,使图像中的文字清晰可读。

值得一提的是,HYPIR 还具备了突出的自然语言理解能力,能够精准捕捉和理解用户的输入指令,在图像复原过程中准确地反映用户的意图。此外,用户可以根据需求灵活调节生成与复原的平衡,或精细控制图像细节程度,从而获得符合自身偏好的结果。

HYPIR 不仅展示了图像修复技术上的创新性,也体现了对实际应用需求的理解。通过打破传统思维定式,该技术在文化传承与保护、影视修复、高分辨率图像生成等领域提供了解决方案

AI在线附 HYPIR 项目官网链接:

https://hypir.xpixel.group/

相关资讯

豆包、Kimi 等国内多款 AI 工具高考期间暂停图片识别问答功能

2025 高考期间,国内多款热门 AI 工具暂停了图片识别问答功能,包括阿里巴巴的通义千问和字节跳动的豆包停止了图片识别功能对试卷问题的响应,而 Kimi、腾讯的元宝则在考试期间完全暂停了图片识别服务。
6/9/2025 10:32:24 PM
汪淼

霸榜之王,年入上亿:AI图片产品Remini的前世今生

最近爆火的黏土 AI 滤镜不知道大家都尝试了没有,五一假期的朋友圈基本上都被它刷屏了。我也用它尝试了黏土化自己刚拍的龙血树森林照片,很不幸我被变成了消防栓。但是这种 AI 造成的失误并不会阻碍大家尝试的热情,而且会成为新的传播点,毕竟好看的图片都很无聊,AI 的错误才比较有趣。 很多人把 Remini 的黏土风效果跟国内的其它产品做对比,大部分会认为这是一家国外公司,但是经过调研居然发现 Remini 最开始其实是一家中国公司做的出海产品,这家创业公司叫做大觥科技。2022 年被著名的擅长二手产品翻新的意大利公司
5/8/2024 12:01:20 AM
逗砂

AI图片泛滥怎么管?OpenAI计划给AI图像添加水印

随着生成式人工智能的高速发展,AI图像正以前所未有的速度在网络上传播。 从AI创作“宫崎骏风格”动画图,到仿真度极高的商品广告照、新闻配图,普通用户只需输入一句话,便可秒产专业级画面。 这种“视觉洪流”的背后,是OpenAI等技术巨头不断推陈出新的图像生成模型——其中最先进的,莫过于不久前发布的ChatGPT-4o内嵌的ImageGen。
4/9/2025 8:00:00 AM
  • 1