AI在线 AI在线

SOTA

图像编辑开源新SOTA,来自多模态卷王阶跃!大模型行业正步入「多模态时间」

全球AI大模型智能涌现,现在正在进入“多模态时间”。 一方面,全球业内各式各样的技术进展,都围绕多模态如火如荼展开。 另一方面,AI应用和落地的需求中,多模态也是最重要的能力。
4/28/2025 2:13:43 PM

多模态生成框架新SOTA:文本+空间+图像随意组合,20W+数据开源,复旦腾讯优图出品

能处理任意条件组合的新生成框架来了! 复旦大学、腾讯优图实验室等机构的研究人员提出UniCombine,一种基于DiT的多条件可控生成框架,能够处理包括但不限于文本提示、空间映射和主体图像在内的任意控制条件的任意组合,并保持高度的一致性和出色的和谐性。 具体效果be like:图片据了解,现有的多条件可控生成框架或是只能处理单一种类的多个条件,或是只适用于某种特定的多类别组合,从而普遍缺乏通用性的多类别 多条件的组合式生成能力。
4/17/2025 2:55:00 AM

一秒十图!英伟达MIT联手刷新SOTA,一步扩散解锁实时高质量可控图像生成

扩散生成模型通常需要50-100次迭代去噪步骤,效率很低,时间步蒸馏技术可以极大提高推理效率,「基于分布的蒸馏」方法,如生成对抗网络GAN及其变分分数蒸馏VSD变体,以及「基于轨迹的蒸馏方法」(如直接蒸馏、渐进蒸馏、一致性模型)可以实现10-100倍的图像生成加速效果。 但仍然存在一些关键难点,比如基于GAN的方法由于对抗动态的振荡特性和模式坍塌问题,训练过程不稳定;基于VSD的方法需要联合训练一个额外的扩散模型,增加了计算开销;一致性模型虽然稳定,但在极少数步骤(例如少于4步)的情况下,生成质量会下降。 如何开发一个能够兼顾效率、灵活性和质量的蒸馏框架成了模型部署的关键。
4/1/2025 5:10:00 AM
新智元

耗时一年半!谷歌新定义具身通用最强SOTA,轰动硅谷!物理世界的原生推理能力、灵活性让人惊掉下巴!网友:亿些震撼!

出品 | 51CTO技术栈(微信号:blog51cto)想知道世界SOTA级别的模型用在物理世界中有多震撼吗? Google DeepMind做了一件破天荒的事情。 大模型自爆火以来,已经过去两年多,但在物理世界中真正能转化为机器人行为,还是一个世界级难题。
3/13/2025 1:37:14 PM
云昭

DiffUCD:扩散模型助力无监督高光谱变化检测,超越SOTA,逼近监督方法!

一眼概览DiffUCD 提出了一种创新的无监督高光谱影像变化检测(HSI-CD)方法,利用 语义相关性扩散模型(SCDM) 和 跨时间对比学习(CTCL),在无需标注的情况下提高检测精度,在多个基准数据集上超越现有方法。 核心问题高光谱影像变化检测(HSI-CD)旨在识别同一区域在不同时刻的地表变化。 然而,受限于以下挑战:• 现有方法依赖大量标注数据,而高质量的人工标注成本高昂。
3/3/2025 5:00:00 AM
萍哥学AI

机器之心升级「SOTA!模型」资源站,万余模型覆盖千余AI任务

机器之心于2022年第一季度推出新版「SOTA 模型」资源站。作为专注服务中国开发者的第三方平台,该站点在对每日学界、业界最新的SOTA工作进行追踪的同时,汇总了原作团队、社区用户所放出的模型文件、实现代码、数据集等开发资源,帮助用户快速上手尝试新技术。当前新版 「SOTA!模型」已收录超过15000个模型资源,覆盖超过1000个AI任务。用户可通过「检索模型」功能基于模型资源所适配的硬件类型、计算平台、框架及模型规模等维度高效查询。作为专业的人工智能信息平台,机器之心于2019年9月发布了首版「SOTA 模型」项
8/5/2022 5:22:00 PM
机器之心

「Pop SOTA!List for AI Developers 2021」社区评价 TOP 128 价值工作完整名录发布!

2022 年初,我们对 2021 年度发布于 arXiv 的「SOTA」AI 论文进行了一轮分析,试图找到 2021 年度,对 AI 开发者最具价值的「Pop SOTA!」工作。但面对超过 2 万篇的「SOTA」工作,我们产生了疑惑 —— 自称「SOTA」的工作就一定是先进的吗?对广大 AI 开发者来说,什么样才是先进的技术工作?是思路具有启发性?还是跑出的实验分数高?是易于实现,对数据资源、计算资源的需求可控?还是放出的代码实现即插即用,可用性强?
1/27/2022 2:05:00 PM
SOTA模型
  • 1