X-SAM

X-SAM：从「分割一切」到「任意分割」：统一图像分割多模态大模型，在20+个图像分割数据集上均达SoTA

本研究由中山大学、鹏城实验室、美团联合完成，第一作者王豪为中山大学博士研究生，主要研究方向为图像和视频分割、开放场景视觉感知、多模态大模型等。论文共同通讯作者为梁小丹教授和蓝湘源副研究员。背景与动机Segment Anything Model (SAM) 作为基础分割模型在密集分割掩码生成方面表现卓越，但其依赖视觉提示的单一输入模式限制了在广泛图像分割任务中的适用性。

8/19/2025 2:49:00 PM

机器之心

资讯热榜

OpenAI更新ChatGPT规则：10月29日起禁止医疗、法律与财务建议 Reddit CEO直言：AI聊天机器人并未带来流量红利，搜索仍是核心引擎 eBay携手ChatGPT开启智能电商新时代，购物体验将全面升级！从AI到泰勒·斯威夫特——源于生活的案例与启示看完刘润年度演讲，教你做好AI时代的能力迁徙！苹果Siri将大变样！付费请谷歌助力AI升级谷歌推出新款 Vertex AI 代理构建工具，助力企业智能化 LangChain 大模型应用开发框架：从 RAG 到 Agent 的完整指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 Midjourney 开源 Meta AI新词微软智能用户 GPT 学习技术智能体马斯克 Gemini 图像 Anthropic 英伟达 AI创作训练 LLM 论文代码算法 Agent AI for Science 芯片苹果 Claude 腾讯 Stable Diffusion 蛋白质开发者生成式神经网络 xAI 机器学习 3D RAG 人形机器人 AI视频研究大语言模型具身智能生成百度 Sora 工具 GPU 华为计算字节跳动 AI设计大型语言模型 AGI 搜索视频生成场景深度学习架构生成式AI DeepMind 编程亚马逊视觉 Transformer AI模型预测特斯拉 MCP