AI在线 AI在线

Google 的 Agent2Agent(A2A)框架详解

作者 | Nirdiamant编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)MCP,市面上已经有不少干货解读了,但作为经常被拿来对比的 A2A,内容却很少,今天为大家详细解读下 A2A 的架构。 想象你走进一个繁忙的办公室,才华横溢的专家们正在处理各类复杂项目。 一个角落里,研究分析师在挖掘数据;旁边,设计专家在绘制视觉方案;另一边,物流协调员在安排货运。

作者 | Nirdiamant

编辑 | 云昭

出品 | 51CTO技术栈(微信号:blog51cto)

MCP,市面上已经有不少干货解读了,但作为经常被拿来对比的 A2A,内容却很少,今天为大家详细解读下 A2A 的架构。

想象你走进一个繁忙的办公室,才华横溢的专家们正在处理各类复杂项目。一个角落里,研究分析师在挖掘数据;旁边,设计专家在绘制视觉方案;另一边,物流协调员在安排货运。当这些专家需要协作时,他们只需相互交谈——共享信息、提出问题、整合才能,解决那些单靠个人无法完成的任务。

但如果每位专家都被封闭在一个隔音室里,虽然仍能出色完成自己的工作,却无法与他人沟通,那么整个办公室的集体效能就会瞬间崩塌。

这正是当前 AI 智能体所面临的挑战。尽管单个 AI 系统在某些专门任务上越来越强,但它们之间往往无法高效协作。这正是 Agent-to-Agent(A2A)框架的用武之地——它是一种让 AI 系统像团队一样协同工作的通信机制。

为什么 AI 智能体需要“对话”

如今的 AI 世界就像一个个“专才孤岛”:有的智能体擅长日程安排,有的精通数据分析,还有的擅长写作创意。但即使这些专长组合在一起能解决更复杂的问题,它们通常仍是各自为战。

想象一个看似简单的请求:“帮我规划下个月去芝加哥的商务行程。”这个任务其实需要多个方面的专长:

日程管理:找出可用时间

旅行知识:预订合适的航班和酒店

预算控制:做出性价比高的选择

地理智能:高效安排会议地点和时间

我们当然可以构建一个超级系统,统筹所有这些功能 —— 一个全能的“超级智能体”。但这样做有两个大问题:

  1. 开发复杂:每加入一个新功能,就必须集成到核心系统中,可能会破坏现有功能。
  2. 重复造轮子:市面上已有成熟的航班预订、日历管理等服务,没必要每家公司都重造一遍。

A2A 的解决方案是:让你专注于构建你最擅长的智能体,其它功能通过连接其他专家智能体来实现。这种模块化方式,让多个专才智能体能协作解决更复杂的问题,而不必每个团队从零开始做一遍。

如果缺乏通信机制,每个专长系统就只能处理问题的一小部分,用户就得在它们之间手动协调,变成“人肉调度中心”。

为 AI 建立通用语言

A2A 提供了一个通用语言,让不同背景、由不同团队开发的 AI 智能体可以相互交流。就像在国际公司中统一使用英语或普通话那样,一旦建立通用语言,协作就成为可能。

A2A 不仅定义了信息如何交换,还定义了任务如何在时间维度上被协调:

  • 介绍协议:智能体可通过“Agent Card”(类似数字简历)互相发现和了解彼此的能力。
  • 任务管理:智能体可以分配任务并跟踪进度。例如,日历智能体可以向旅行智能体正式发出请求,并监控任务状态。
  • 丰富通信格式:不仅限于文字,还支持图片、结构化数据、文件等协作必需的格式。
  • 澄清机制:如果任务信息不明确,智能体可暂停任务并请求澄清,就像人类同事会补充提问一样。

A2A 如何运作:幕后协同一览

假设你对你的 AI 助理说:“帮我策划下周末女儿的生日派对。”

在你看不到的幕后,主助理(比如叫 Alex)会识别这个请求涉及多个领域,并利用 A2A 这样协作:

  1. 发现专家智能体:Alex 会在其 Agent Card 目录中查找擅长活动策划、餐饮建议和邀请函设计的智能体。技术上,它会请求这些智能体的 Agent Card(一般是托管在像 https://agent-domain/.well-known/agent.json 的 JSON 文件),里面列出能力、通信端点和认证信息。
  2. 创建任务并发送请求:
  • 向活动策划智能体发出请求:“为8岁女孩的生日派对(下周六下午)推荐场地和活动方案。”
  • 向餐饮顾问请求:“为12位孩子和6位成人提供蛋糕与食物方案。”
  • 向设计智能体发出任务:“设计儿童生日派对邀请函模板。”
  1. 任务状态管理:
  • 每个任务都有唯一ID,状态从“已提交 → 处理中 → 完成/失败/待补充信息”。

  • 若活动策划智能体回复:“你的预算是多少?”(状态改为 input-required),Alex 会基于用户资料或提问用户,然后更新任务状态。

  • 餐饮顾问返回结构化菜单、价格和饮食偏好数据(DataPart),Alex 可将其转为用户界面展示。

  • 设计智能体制作邀请函图片文件,并作为 FilePart 封装成 Artifact(工件),标记任务完成。

  1. 实时进度流:长时间任务可以通过 SSE(Server-Sent Events)实时更新进度。

  2. 认证机制:智能体之间使用 OAuth、API Key 等企业级协议进行认证。

最终你只与 Alex 对话,完全无需操心背后调度了多少个 AI,整个过程协调流畅,结果自然一致,这就是 A2A 的魅力。

A2A 在 AI 生态中的定位

A2A 并不是孤立存在的,它是更广泛 AI 互操作趋势的一部分。另一个重要协议是 MCP(Model Context Protocol),专注于让单个智能体更好地使用工具和上下文。

可以这样理解:

  • A2A:像是让同事之间能顺畅沟通的协作协议。
  • MCP:像是为每位员工配备他们需要的工具和信息。

它们并不冲突,而是互补。一个智能体可以通过 MCP 获取执行任务的工具和上下文,然后通过 A2A 与其他智能体协同完成多步骤任务。

这代表了 AI 设计理念的转变 —— 从“万能型孤岛”模型走向“专才网络协作”,就像人类社会演化出分工与协作一样。

A2A 的技术架构

在这些通俗比喻背后,A2A 实际上实现了一整套技术机制,使智能体协作成为可能:

  1. 客户端-服务器模型:任意 A2A 交互中,一个智能体是客户端(发起方),另一个是服务器(响应方)。角色可以视上下文切换。
  2. Agent Card(能力卡片):JSON 格式的能力清单,通常托管在标准路径(如 /.well-known/agent.json),包含:
  • 智能体能力与支持操作
  • 通信端点 URL
  • 认证方式要求
  • 支持的消息与内容类型
  1. 任务状态管理(Task Lifecycle):
  • 每个任务都有唯一 ID

  • 生命周期包括:submitted、working、input-required、completed、failed、canceled

  • 还包含时间戳、任务归属等元信息

  1. 消息结构(Message Structure):

  • TextPart:普通文字或富文本内容

  • DataPart:结构化数据(如 JSON)

  • FilePart:二进制或文件引用

  • 每条消息由若干部分(Part)组成:

  • 每部分都有 MIME 类型说明其内容格式

  1. 传输协议:

  • 通常使用 HTTP/HTTPS

  • 标准 REST 接口用于任务创建与更新

  • Server-Sent Events (SSE) 用于任务实时进度推送

  • 可选 Webhook 支持异步通知

  1. 安全机制:

  • OAuth 2.0 流程

  • API 密钥

  • JWT 令牌

  • 访问控制权限

这一架构足以支撑从简单问答到长时间运行的复杂协作流程。

图片图片

总结:集体智慧大于个体能力之和

A2A 的真正力量,在于我们不再局限于单个 AI 的功能,而是构建一个“专才协作网络”。正如人类社会因分工和协作而快速进步,AI 也将在智能体间协作的基础上实现质的飞跃。

A2A 带来以下优势:

  • 模块化进化:只需替换某个智能体,无需重构整个系统
  • 渐进式自动化:原本需要人工协调的任务,可由智能体自动完成
  • 专精能力释放:不再追求“全能但平庸”的 AI,而是打造各领域最强智能体

未来的 AI,不是一个无所不能的超级智能,而是一群高效协作的专业智能体。A2A 正是实现这种协作的通信基础设施,助力 AI 真正进入处理现实世界复杂任务的新时代。

展望未来

随着 A2A 等框架推动 AI 智能体协作能力不断提升,我们将从“控制工具”走向“委托任务”。用户体验将越来越简单,而 AI 的能力却愈发强大 —— 这是成熟技术的标志。

就像一群围坐会议桌前的同事集思广益,AI 智能体通过 A2A 协议,可以融合各自的专业视角,提出任何单一智能体都无法实现的解决方案。

这,正是 A2A 的承诺 —— 不只是更聪明的个体 AI,而是更聪明的协作。

参考链接:https://medium.com/@nirdiamant21/googles-agent2agent-a2a-explained-751340c78e99

相关资讯

谷歌I/O开发者大会中国站:大模型技术进入全生态

本周三,谷歌在北京召开了中国开发者大会。除 5 月加州山景城的 I/O 大会之外,今年的 I/O Connect 环球之旅从德国柏林开始、到印度班加罗尔,也已来到中国北京。在这次活动中,来自多个不同领域的专家为国内开发者深入分享了谷歌在 AI、Web、移动端、云技术等领域的最新技术进展、开发工具和全球服务平台等内容。「中国是全球最大的开发者市场之一,我们的开发者一直是全球舞台上不可或缺的先锋力量,」谷歌大中华区总裁陈俊廷在开幕演讲中表示。「过去一年,来自中国的 25 个开发团队共有 31 款游戏和应用,在全球不同的
8/9/2024 5:37:00 PM
李泽南

谷歌内部项目:大模型AI智能体发现了代码漏洞

开源数据库引擎 SQLite 有 bug,还是智能体检测出来的! 通常,软件开发团队会在软件发布之前发现软件中的漏洞,让攻击者没有破坏的余地。 模糊测试 (Fuzzing)是一种常见的软件测试方法,其核心思想是将自动或半自动生成的随机数据输入到一个程序中,并监视程序异常。
11/2/2024 2:56:00 PM
机器之心

量大管饱全线开花!一文看懂2025 Google I/O开发者大会

今年,Google 算是打了个翻身仗。 不断的掏出新东西,不断的让大家,感受到惊喜。 而万众期待的 Google I/O 开发者大会,终于在昨天凌晨 1 点正式开始了。
5/22/2025 2:13:11 AM
数字生命卡兹克
  • 1