可学习图像匹配器

用基础模型指导特征传播，首个泛化型图像匹配器OmniGlue搞定未见过域

第一个以「泛化」能力为核心设计原则的可学习图像匹配器来了！对于想要获取两张图像之间的细粒度视觉对应关系而言，局部图像特征匹配技术是高不错的 xuanz，对于实现准确的相机姿态估计和 3D 重建至关重要。过去十年见证了从手工制作到基于学习的图像特征的演变。最近，研究社区又提出了新颖的可学习图像匹配器，在传统基准上实现了性能的不断改进。尽管已经取得了长足的进步，但这些进展忽略了一个重要方面：图像匹配模型的泛化能力。如今，大多数局部特征匹配研究都集中在具有丰富训练数据的特定视觉领域（如室外和室内场景），这就导致了模型高度

5/27/2024 3:17:00 PM

机器之心

资讯热榜

DeepSeek R1-0528震撼发布:免费128K上下文，性能直逼OpenAI o3! 实测 Google Veo 3：AI 视频终于能开口“说话”了（附白嫖攻略+提示词技巧）字节发布图像Agent“小云雀AI” 打造一键爆款创作神器小米多模态大模型Xiaomi MiMo-VL开源 Manus Slides重磅发布：一键生成专业幻灯片正式开源！DeepSeek-R1-0528震撼发布，性能直逼OpenAI o3，免费API已上线 Mistral 推出 Agents API:为企业打造可协作、可记忆的 AI 代理 Meta Announces Reorganization of AI Division: Split into AI Products and AGI Foundations Teams

标签云

人工智能 AI OpenAI AIGC ChatGPT 模型 DeepSeek AI绘画机器人数据谷歌大模型 Midjourney 用户智能开源微软 GPT 学习 Meta 图像技术 AI创作 Gemini 论文马斯克 Stable Diffusion 算法代码芯片英伟达生成式蛋白质开发者 Anthropic 腾讯研究神经网络 3D 计算生成 Sora 机器学习苹果 AI设计 AI for Science GPU 训练 AI视频华为智能体 Claude 搜索人形机器人场景百度 xAI 预测伟达大语言模型深度学习 Transformer 字节跳动模态具身智能 LLaMA 文本神器推荐 Copilot 视觉驾驶 Agent API 应用算力工具大型语言模型安全干货合集视频生成