可学习图像匹配器
用基础模型指导特征传播,首个泛化型图像匹配器OmniGlue搞定未见过域
第一个以「泛化」能力为核心设计原则的可学习图像匹配器来了!对于想要获取两张图像之间的细粒度视觉对应关系而言,局部图像特征匹配技术是高不错的 xuanz,对于实现准确的相机姿态估计和 3D 重建至关重要。过去十年见证了从手工制作到基于学习的图像特征的演变。最近,研究社区又提出了新颖的可学习图像匹配器,在传统基准上实现了性能的不断改进。尽管已经取得了长足的进步,但这些进展忽略了一个重要方面:图像匹配模型的泛化能力。如今,大多数局部特征匹配研究都集中在具有丰富训练数据的特定视觉领域(如室外和室内场景),这就导致了模型高度
5/27/2024 3:17:00 PM
机器之心
- 1
资讯热榜
DeepSeek R1-0528震撼发布:免费128K上下文,性能直逼OpenAI o3!
实测 Google Veo 3:AI 视频终于能开口“说话”了 (附白嫖攻略+提示词技巧)
字节发布图像Agent“小云雀AI” 打造一键爆款创作神器
小米多模态大模型Xiaomi MiMo-VL开源
Manus Slides重磅发布:一键生成专业幻灯片
正式开源!DeepSeek-R1-0528震撼发布,性能直逼OpenAI o3,免费API已上线
Mistral 推出 Agents API:为企业打造可协作、可记忆的 AI 代理
Meta Announces Reorganization of AI Division: Split into AI Products and AGI Foundations Teams
标签云
人工智能
AI
OpenAI
AIGC
ChatGPT
模型
DeepSeek
AI绘画
机器人
数据
谷歌
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
芯片
英伟达
生成式
蛋白质
开发者
Anthropic
腾讯
研究
神经网络
3D
计算
生成
Sora
机器学习
苹果
AI设计
AI for Science
GPU
训练
AI视频
华为
智能体
Claude
搜索
人形机器人
场景
百度
xAI
预测
伟达
大语言模型
深度学习
Transformer
字节跳动
模态
具身智能
LLaMA
文本
神器推荐
Copilot
视觉
驾驶
Agent
API
应用
算力
工具
大型语言模型
安全
干货合集
视频生成