AI在线 AI在线

颜水成

不再靠「猜坐标」!颜水成团队等联合发布PaDT多模态大模型:实现真正的多模态表征输出

近年来,多模态大语言模型(Multimodal Large Language Models, MLLMs)在图文理解、视觉问答等任务上取得了令人瞩目的进展。 然而,当面对需要精细空间感知的任务 —— 比如目标检测、实例分割或指代表达理解时,现有模型却常常「力不从心」。 其根本原因在于:当前主流 MLLMs 仍依赖将视觉目标「翻译」成文本坐标(如 [x1, y1, x2, y2] )的方式进行输出。
10/16/2025 10:17:00 AM
机器之心

分布式人工智能盛会DAI 2024征稿:Agent Day,强化学习之父Richard Sutton将出席!颜水成、Sergey Levine以及DeepMind科学家将做主旨报告

会议简介随着科技的飞速发展,人工智能已经成为了推动社会进步的重要力量。在这个时代,我们有幸见证并参与到分布式人工智能(Distributed Artificial Intelligence, DAI)的创新与应用中。分布式人工智能是人工智能领域的重要分支,这几年引起了越来越多的关注。基于大型语言模型(LLM)的智能体(Agent)异军突起,通过结合大模型的强大语言理解和生成能力,展现出了在自然语言交互、知识推理、任务规划等方面的巨大潜力。AI Agent正在接棒大语言模型,成为当前AI圈的热点话题。Auto-GPT
8/22/2024 4:25:00 PM
新闻助手

颜水成加入昆仑万维,任天工智能联席CEO、2050全球研究院院长

AI 大牛颜水成,要来造通用人工智能了。
9/4/2023 9:22:00 AM
机器之心

颜水成、David Silver等10人入选,2022 AAAI Fellow名单公布

2022 年度 AAAI Fellows 共有 10 位学者入选。
2/15/2022 2:42:00 PM
机器之心
  • 1