AI在线 AI在线

用“因果规划”解决多智能体协作中的任务依赖难题|港科广&腾讯

在长周期、多步骤的协作任务中,传统单智能体往往面临着任务成功率随步骤长度快速衰减,错误级联导致容错率极低等问题。 为了应对这些问题,就需要构建具备全局规划与因果依赖管理能力的分布式智能体框架,并在真实游戏中验证效能。 基于此,来自港科广和腾讯的研究团队提出了CausalMACE方法,通过将因果推理机制系统性地引入开放世界多智能体系统,为复杂任务协同提供了可扩展的工程化解决方案。

在长周期、多步骤的协作任务中,传统单智能体往往面临着任务成功率随步骤长度快速衰减,错误级联导致容错率极低等问题。

为了应对这些问题,就需要构建具备全局规划与因果依赖管理能力的分布式智能体框架,并在真实游戏中验证效能。

基于此,来自港科广和腾讯的研究团队提出了CausalMACE方法,通过将因果推理机制系统性地引入开放世界多智能体系统,为复杂任务协同提供了可扩展的工程化解决方案。

目前,该工作已中稿EMNLP 2025 Findings。

用“因果规划”解决多智能体协作中的任务依赖难题|港科广&腾讯

全局因果任务图

为了让一群AI像项目团队一样,既分工明确又能动态调整。论文提出“全局因果任务图”概念,让AI学会“如果-那么”的逻辑。

换句话说,就是先搭地基再砌墙,先找食材再下锅。

用“因果规划”解决多智能体协作中的任务依赖难题|港科广&腾讯

具体来说,全局因果任务图包含两个部分:

  • 因果干预模块:引入平均处理效应 (ATE) 量化每条依赖边与游戏规则的一致性,自动剔除由大模型先验幻觉导致的错误依赖
  • 负载感知调度:基于 DFS 路径搜索与动态“繁忙率”指标,实现多智能体实时任务再分配

而在方法框架层面,CausalMACE则包含“判断”、“规划”、“执行”三个环节。

用“因果规划”解决多智能体协作中的任务依赖难题|港科广&腾讯

Judger——“裁判”

实时验证动作是否合法,并给出成败反馈,保证所有智能体在同一套游戏规则下行动。

Planner——“总工”

先把复杂任务拆成若干“小工单”,一次性列清。

然后再按游戏规则画一张“粗线条流程图”。

之后,再用因果推理“精修”这张图,对每一条先后关系,让大模型回答“如果游戏规则变了,这条先后关系还成立吗?”

如果,所有规则改变均不影响关系的成立,就删掉这条关系,避免 AI 做无用功。

经过这轮“去伪存真”,得到一张干净、可执行的任务因果图。

Worker——“调度室”

首先,用深度优先搜索把因果图拆成多条“生产线”,给每条生产线实时计算“繁忙指数”。其中,正在这条线上干活的 AI 越多、离起点越远,指数越高。

接下来,让新来的AI自动加入指数最低的那条线,既避免扎堆,也减少等待。每完成一步,AI 向 Planner 申请下一步任务,整个过程持续迭代。

实验结论:完成率效率双增强

用“因果规划”解决多智能体协作中的任务依赖难题|港科广&腾讯

在 VillagerBench 三项基准任务(建造、烹饪、密室逃脱)中,相较 AgentVerse 与 VillagerAgent 基线,任务完成率最高提升 12%,效率提升最高达 1.5 倍。

代理工作量更加平衡,相同设置下最大增益达到13%。

用“因果规划”解决多智能体协作中的任务依赖难题|港科广&腾讯

One more thing

这篇论文的通讯作者是来自香港科技大学(广州)的助理教授、博士生导师——王浩教授。

他2023年博士毕业于新加坡南洋理工大学,曾在TikTok、地平线等公司科研工作。

主要研究兴趣为大模型生成式智能体和三维重建。发表TPAMI、IJCV、CVPR、NeurIPS等领域顶级会议期刊论文50余篇。主持国家自然科学基金青年项目,参与国家科技部国家重点研发计划项目,获2023年SMP-IDATA晨星青年基金、2024年腾讯犀牛鸟专题项目。

论文链接: http://arxiv.org/abs/2508.18797

相关资讯

掌控 AI 智能体自主性:五级框架下的人机协作之道

大家好,我是肆〇柒,在AI飞速发展的时代,AI 智能体自主性已成为一个备受瞩目的焦点。 一方面,它能够为我们带来前所未有的创新应用,极大提升工作效率和生活便利性;另一方面,若不当使用,也可能引发一系列难以预料的风险。 随着大型语言模型(LLM)等前沿 AI 技术的飞速进步,AI 智能体的自主性不再是停留在科幻小说中的情节,它已逐渐走进现实,引起了大家的广泛关注和深入探讨。
7/29/2025 9:24:21 AM
肆零柒

Nature:全球博士生数量锐减,钱少、事多、前途迷茫

过去几年,一些国家的博士项目申请人数出现下滑,有专家警告称,这是一个令人担忧的趋势。 从澳大利亚、日本到巴西和英国,高昂的生活成本、微薄的助学金以及毕业后有限的就业前景,正在阻碍人们攻读博士学位。 据经合组织(OECD)巴黎总部项目负责人斯拉里科表示,这些下降的数据应该「敲响警钟」。
2/17/2025 10:30:00 AM
新智元

复旦主导,中美等8个国家25家单位44名学者联合发布大模型安全技术综述

近年来,随着大模型的快速发展和广泛应用,其安全问题引发了社会各界的广泛关注。 例如,近期发生的「全球首例利用 ChatGPT 策划的恐袭事件」再次敲响了警钟,凸显了大模型安全问题的紧迫性和重要性。 为应对这一挑战,来自中美英德等 8 个国家 25 家高校和科研机构的 44 位 AI 安全领域学者联合发布了一篇系统性技术综述论文。
2/20/2025 11:31:31 AM
机器之心
  • 1