影像
零样本 | ZAPS:零样本扩散采样,3倍加速逆问题重建,重塑高效影像修复新范式
一、 一眼概览ZAPS(Zero-Shot Approximate Posterior Sampling)是一种针对扩散模型(Diffusion Models, DMs)在逆问题(Inverse Problems)中的高效采样方法。 它利用零样本学习(Zero-Shot Learning)进行自适应超参数优化,使得扩散采样步骤固定,同时提高重建质量并减少推理时间。 二、核心问题当前的扩散模型在解决逆问题(如去模糊、修复、超分辨率)时,存在以下挑战:需要大量的采样步骤,导致推理速度慢;现有的噪声调度策略(Noise Schedule)在逆问题场景下难以直接适用;传统方法使用手动调整的对数似然权重(Log-Likelihood Weights),不够鲁棒,容易导致次优解。
2/8/2025 11:12:34 AM
萍哥学AI
“一超多能”年度高端旗舰,vivo X200系列正式发布
10月14日,全新一代vivo X200系列旗舰手机在国家游泳中心(水立方)发布。作为重磅登场的国产旗舰系列,vivo X200系列首次集齐全面升级的四大vivo蓝科技,带来“一超多能”年度旗舰手机。vivo X200 Pro搭载Ultra同款蔡司2亿APO超级长焦并升级自研大模型画质增强算法,蔡司大底T*主摄采用vivo与索尼联合定义全新一代图像传感器蓝图x索尼LYT-818,实现移动影像能力的“超级”进化。
10/14/2024 11:07:00 PM
新闻助手
武大等开源大幅面高清卫星影像数据集:涵盖 21 万 + 地理目标,复杂地理空间场景知识精准生成
AI 卫星影像知识生成模型数据集稀缺的问题,又有新解了。来自武汉大学、上海 AI 实验室、西工大等 9 家机构共同推出了该领域的大型数据集,涵盖了 21 万个地理目标和 40 万个目标-关系三元组。而且像机场、港口、立交桥等这样复杂地理空间场景,也都包括在了数据集当中。具体来说,该数据集名为 RSG,主要面向卫星影像中的目标检测(OBD)和场景图生成(SGG)任务。SGG 有助于促进模型对地理空间场景从感知到认知的智能理解,但一直缺乏大幅面、超高分辨率的卫星影像数据。而 RSG 的出现很好地填补了这一空白,一同提出
6/21/2024 1:28:04 PM
汪淼
重新定义Ultra标准,vivo X100系列新品正式发布
5 月 13 日,vivo X100 系列新品三舰齐发,宣布与蔡司签署全新的联合研发扩展协议,以自研和共研并行的开放体系,与蔡司共同探索移动影像新高度。同时推出了蓝图影像,在 X100 系列上市的蓝图影像专属于 vivo|蔡司联合研发产品线,代表了 vivo 影像在关键场景的认知与积累。vivo 已经连续三年稳坐国产手机销量第一。今年 Q1,vivo 持续保持了第一成绩,满分旗舰 X100 系列功不可没。在 vivo X100、vivo X100 Pro 持续热销收获好口碑之时,vivo 此次升级发布了 vivo
5/14/2024 1:59:00 PM
新闻助手
美图携手ACM Multimedia 2022举办第四届PIC竞赛 聚焦美妆场景
2022年7月1日,美图影像研究院(MT Lab)联合北京航天航空大学、中国人民大学在ACM国际多媒体会议(ACM International Conference on Multimedia, ACM MM)上主办的第四届Person in Context(PIC)竞赛圆满收官。 此次PIC竞赛因其前沿性和实用性吸引了来自清华大学、北京大学、上海交通大学、香港大学、中国科学技术大学等知名高校,以及腾讯、京东、小米、bilibili等知名企业共58支队伍报名参赛,参赛人数再创新高。竞赛共分设三个赛道,涵盖视频内容时
6/25/2023 5:58:00 PM
美图影像研究院
美图影像节发布7款影像生产力工具,推出懂美学的视觉大模型
6月19日,美图公司举办以“AI时代的影像生产力工具”为主题的第二届影像节,现场发布7款新品:AI视觉创作工具WHEE;AI口播视频工具开拍;桌面端AI视频编辑工具WinkStudio;主打AI商业设计的美图设计室2.0;AI数字人生成工具DreamAvatar;美图AI助手RoboNeo;美图视觉大模型MiracleVision。 全面提供从生活场景到生产力场景影像服务的同时,美图公布了最新的VIP会员数量,截至6月18日,美图全球VIP会员数为719万。 美图公司创始人、董事长兼首席执行官吴欣鸿介绍说:“过去美
6/25/2023 5:57:00 PM
美图影像研究院
vivo影像战略发布,新一代自研影像芯片及多项新技术亮相
2022 年 10 月 24 日,vivo 影像战略发布会正式召开。会上,vivo 盘点了之前在影像理念上的坚持,即通过专业化的能力还原眼之所见,超越眼之所见,并将专业影像技术赋能每一个人,持续为消费者提供人性化的专业影像体验。vivo 的影像技术矩阵也在此次影像战略发布会正式公布:围绕“三个比肩”,坚持联合创新和自主创新两大战略支点,在日趋同质化的影像赛场中创造竞争优势,力求在移动影像赛道上筑起技术壁垒,并保持持续领先。 vivo 影像副总裁于猛vivo 影像副总裁于猛、vivo 影像产品高级总监李卓、蔡司消费光
10/24/2022 3:32:00 PM
新闻助手
达摩院发布AI遥感分析云平台,助力提升地球科学研究效率
3月3日,达摩院发布AI Earth地球科学云平台,平台集成了PB级开源卫星遥感数据、十余种遥感AI算法、云端高性能计算和存储资源,助力研究者开展农业灾害分析、气候变化分析、水体水质分析等科研工作。卫星遥感影像是人类对地观测的重要信息来源,但获取、处理以及分析应用卫星遥感数据的链路较长、成本较高。研究人员需要向卫星数据运营机构申请获取数据或者下载行业公开数据,在本地计算机存储配置后才能进行数据分析。而分析环节对机器的计算和存储资源要求较高,普通计算机无法满足大规模影像数据分析的需求。另外,现有分析方法自动化程度低、
3/3/2022 4:34:00 PM
新闻助手
- 1
资讯热榜
告别抽卡!Vidu Q2多图参考生视频功能重磅上线
最强OCR竟然不是DeepSeek、Paddle!HuggingFace新作:六大顶尖开源OCR模型横评!继DS后又杀出匹黑马!
切斯基:Airbnb 暂缓接入 ChatGPT,AI 客服已用上通义千问
独立开源大佬的疯狂实验:Claude Code蛮力出奇迹!40 分钟跑通 DeepSeek-OCR,我一行代码都没写
OpenAI、Oracle 再加码 AI 基建:150亿美元 Lighthouse 园区启动建设
大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘
AI赋能,重塑零售:详解零售巨头塔吉特的业务转型策略
OpenAI 内部警示:ChatGPT Atlas 面临“即时注入”安全威胁
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
芯片
AI for Science
Agent
腾讯
Stable Diffusion
苹果
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
研究
RAG
AI视频
生成
大语言模型
Sora
工具
百度
具身智能
GPU
华为
计算
字节跳动
AI设计
搜索
AGI
大型语言模型
视频生成
场景
深度学习
架构
DeepMind
编程
生成式AI
视觉
预测
Transformer
AI模型
伟达
特斯拉
Copilot