AI在线 AI在线

自监督学习

AGILE:视觉学习新范式!自监督+交互式强化学习助力VLMs感知与推理全面提升

现有视觉语言大模型(VLMs)在多模态感知和推理任务上仍存在明显短板:1. 对图像中的细粒度视觉信息理解有限,视觉感知和推理能力未被充分激发;2. 强化学习虽能带来改进,但缺乏高质量、易扩展的 RL 数据。
10/20/2025 4:34:00 PM
机器之心

Meta 发布 DINOv3,无需标注数据的通用图像处理 AI 新模型

Meta 近日宣布推出 DINOv3,这是一种无需标注数据的通用图像处理 AI 模型。 该模型基于 17亿张图像进行自监督学习训练,并构建了 70亿个参数,使其能够处理各种图像任务和领域,几乎无需任何调整。 这一特性使得 DINOv3在那些标注数据有限的专业领域,如卫星图像处理,具有尤其重要的应用价值。
8/18/2025 10:32:15 AM
AI在线