AI在线 AI在线

Agent不是被卡住了,其实在思考

在与用户进行自然对话时,智能体承担着两大核心任务:一是流畅的对话交流,二是精准的推理与规划。 智能体必须整合所有可用信息以作出回应,同时确保其行为始终围绕既定目标展开。 基于人类“快速思考”和“慢速思考”的认知系统灵感,丹尼尔·卡尼曼提出了一个全新的架构Talker-Reasoner,旨在模拟人类的这两种思维模式。

在与用户进行自然对话时,智能体承担着两大核心任务:一是流畅的对话交流,二是精准的推理与规划。智能体必须整合所有可用信息以作出回应,同时确保其行为始终围绕既定目标展开。

基于人类“快速思考”和“慢速思考”的认知系统灵感,丹尼尔·卡尼曼提出了一个全新的架构Talker-Reasoner,旨在模拟人类的这两种思维模式。

图片

论文地址:

复制
paper: https://arxiv.org/pdf/2410.08328
title: Agents Thinking Fast and Slow: A Talker-Reasoner Architecture Google DeepMind

代理被分为两个部分:一个快速直观的“Talker”代理(系统1)和一个慢速、深思熟虑的“Reasoner” 代理(系统2)。Talker代理负责与用户进行自然语言对话,而Reasoner代理负责复杂的问题解决、信念形成和决策。两者通过记忆进行交互。

图片图片

  1. 快速响应型的Talker组件(第一系统):它的主要职责是处理用户的自然语言交互并生成相应回复。这一组件类似于人类的本能反应,能够快速从存储系统中提取所需信息来支持对话。每当用户发起互动时,Talker组件就会被触发,并通过访问存储系统来指导其回应过程。
  2. 深度思考型的Reasoner组件(第二系统):它专注于执行需要深入思考的多步推理和规划任务。该组件不仅负责调用各种工具和执行具体操作,还要更新系统状态。同时,它也承担着构建和更新用户信念状态的任务,这些信息会以结构化的语言形式保存在存储系统中。

论文在睡眠辅导的现实世界场景中实例化并验证了Talker-Reasoner双代理架构。这个案例研究允许定性测试Reasoner的规划和推理能力以及Talker的互动性。

睡眠辅导智能系统案例分析

睡眠辅导智能系统的构建:

  1. Talker智能体:利用专家提供的指导原则,编码睡眠领域的专业知识。这些原则描述了智能体的特性(如表现同理心、进行对话交流、提供准确建议)和睡眠辅导的各个阶段(包括理解、目标设定和辅导计划)。Talker智能体基于强大的语言模型实现,能够理解复杂模式并生成深思熟虑的对话回应。
  2. Reasoner智能体:专门对用户信念进行建模。研究者与临床专家合作,设计了一个JSON/XML格式的信念模式,涵盖睡眠问题、目标、习惯、障碍和睡眠环境等方面。在执行多步推理/规划时,Reasoner智能体推断并更新这些模式字段,从而创建或修改其信念状态。
  3. Talker和Reasoner的协作:Talker智能体是否等待Reasoner智能体完成操作,取决于当前的信念状态。在制定辅导计划阶段,Talker智能体会等待Reasoner智能体;其他情况下则不会等待。

定性分析结果:

  1. 对话示例:Talker和Reasoner智能体之间的互动过程,包括如何根据用户需求生成回应和制定计划,以及如何根据用户反馈调整方案。
  2. 基于反馈的计划调整:Reasoner智能体如何根据Talker智能体从用户处收集的反馈来优化其计划。

以下是一段示例对话,展示了Reasoner和Talker之间的互动:

复制
用户:嘿,我需要你的帮助来规划如何营造一个放松的睡前环境。(记忆中的信念更新为:{updated-context: starting context, updated-title: Sleep Coaching, coachingphase: UNDERSTANDING})
Talker:太好了,我们开始为你打造一个放松的睡前环境吧:-) 你的卧室里有没有什么可能会干扰你睡眠的东西?
用户:我觉得噪音和光线太分散注意力了。你能帮我制定一个消除这些干扰的计划吗?(记忆中的信念保持不变)
Talker:当然可以!这里有一个消除卧室干扰的计划:噪音:确定噪音源,隔绝外界噪音,使用遮光窗帘来阻挡光线和减少噪音;考虑使用降噪窗帘或隔音板;试试耳塞或白噪音机。光线:...记住,一致性是关键。每晚都坚持这个计划,以营造一个平静而黑暗的睡眠环境。还有什么我可以帮助你的吗?
用户:当然,这很有用。不过,我希望步骤能更详细一些。还想看看如何在我的卧室里营造一个宁静放松的氛围的资源。(记忆中的信念更新为:{user context: UserCollectedContextData(primary-sleep-concern: Noise and light distractions in the bedroom), coaching phase: CoachingPhase(value=PLANNING)})
Reasoner的计划:当然!让我们更深入地看看你的计划的第一步:步骤:选择一个平静的色彩调色板。描述:在选择卧室颜色时,选择柔和的中性色调,如柔和的蓝色、绿色或灰色。这些色调已被科学证明可以促进放松和宁静。1. YouTube视频:(链接)标题:创造放松和无压力卧室的墙面颜色创意。频道:roomdsignTV。推理:这个来自roomdsignTV的视频提供了平静卧室色彩调色板的视觉示例。它展示了舒缓色彩对营造宁静氛围的影响。2. YouTube播放列表:(链接)标题:Berger油漆色彩组合。频道:Hresun Interiors。推理:这个来自Hresun Interiors的播放列表提供了一系列的卧室色彩组合创意。它涵盖了从传统到现代的多种风格,帮助你找到适合卧室的完美色彩方案。
Talker:复制Reasoner的回应

如果对内容有什么疑问和建议可以私信和留言,也可以添加我加入大模型交流群,一起讨论大模型在创作、RAG和agent中的应用。

相关资讯

Agent-as-a-Judge:用AI智能体来评估AI智能体的工作 节省97% 的时间

在当前人工智能的迅猛发展中,评估智能代理的能力成为了一个重要课题。 为此,Agent-as-a-Judge(代理法官)项目应运而生,它不仅是一个技术库,更是一种全新的评估理念。 该项目旨在通过智能代理对其他代理的工作进行评判,以生成高质量的数据集,并推动跨领域的研究。
5/7/2025 6:00:54 PM
AI在线

揭开深度强化学习的神秘面纱

编辑 | 萝卜皮深度强化学习是人工智能最有趣的分支之一。它是人工智能社区许多显着成就的基石,它在棋盘、视频游戏、自动驾驶、机器人硬件设计等领域击败了人类冠军。深度强化学习利用深度神经网络的学习能力,可以解决对于经典强化学习(RL)技术来说过于复杂的问题。深度强化学习比机器学习的其他分支要复杂得多。在这篇文章中,我们将尝试在不涉及技术细节的情况下,揭开它的神秘面纱。状态、奖励和行动每个强化学习问题的核心都是代理和环境。环境提供有关系统状态的信息。代理观察这些状态并通过采取行动与环境交互。动作可以是离散的(例如,拨动开
9/10/2021 4:16:00 PM
ScienceAI

端侧设备AI代理优化框架问世,领域内准确率可达97%

AIxiv专栏是AI在线发布学术、技术内容的栏目。过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:[email protected][email protected]文章由NEXA AI团队联合MIT-IBM Watson AI Lab一起开发。一作Wei Chen(陈伟)是NEXA AI联合创始人,CEO兼首席科学家,斯坦福大学博士,拥有丰富的人工智
7/15/2024 11:02:00 AM
机器之心

想要开发AI代理?首先,你需要了解这些

出品 | 51CTO技术栈(微信号:blog51cto)如何理解AI代理,它们如何工作? 想象一下开发一个生成式AI时代的API。 这个API将支持自然语言输入,利用大型语言模型的智能,通过与SaaS和企业系统的集成来自动化决策,并通过连接到其他生成式AI支持的API来实现业务流程编排。
2/8/2025 10:29:03 AM

OpenAI 最近悄无声息地推出了另一个代理框架,说实话,这玩意儿有点酷

老实说,我们早就习惯了 OpenAI 夸大承诺、交付平平的套路。 记得当年他们推出 Sora 时,夸下海口称这技术会让好莱坞彻底颠覆,用户只需对 Netflix 描述想看的内容,一部完整的电视剧便能在 11 分半钟内生成。 结果自然没能兑现那些狂言。
2/11/2025 8:27:11 AM
dev

15 个在2025 实现AI 代理商业创意

AI 肯定会成为未来……2025 年最大的商业机会肯定是 AI 代理。 如果您希望构建一些有利可图的东西,那么这就是您的好机会。 实际上,AI 代理是自主应用程序,我们知道它可以为您处理任务——节省时间、精力和金钱。
2/13/2025 10:39:23 AM
佚名

打破AI遗忘诅咒的学习算法,慕尼黑-南大团队打造会自主积累知识的学习框架

编辑丨&人类可以在一生中不断积累知识并发展越来越复杂的行为和技能,这种能力被称为「终身学习」。 这种终身学习能力被认为是构成一般智能的基本机制,但人工智能的最新进展主要在狭窄的专业领域表现出色,对于这种终身学习能力显得有些缺乏。 慕尼黑大学与南京大学的研究团队联手打造了一款机器人终身强化学习框架,它通过开发一个受贝叶斯非参数域启发的知识空间来解决这一差距。
2/17/2025 2:58:00 PM
ScienceAI

副业要赚翻?这六款 AI 代理简直像开挂

AI 代理(AI Agents)能够让繁琐的人工工作实现高度自动化,而且速度快、准确度高。 它们在写代码、做营销、创作视频以及其他创意或业务领域都越来越出色。 如果现在还不使用 AI 代理,可能很快就会落后。
3/3/2025 8:10:00 AM
dev

Adobe 联合高校推出 METAL 框架:多智能体协作生成精准图表

在当今数据可视化领域,生成准确反映复杂数据的图表仍然是一项微妙的挑战。 图表不仅需要捕捉精确的布局、色彩和文本位置,还需将这些视觉细节转化为代码,以重现预期的设计。 然而,传统方法通常依赖于直接提示视觉 - 语言模型(VLM),如 GPT-4V,这在将复杂视觉元素转化为语法正确的 Python 代码时,常常遇到困难。
3/3/2025 2:33:00 PM
AI在线

亚马逊重磅出击,成立智能代理 AI 团队

根据路透社的报道,亚马逊最近在其云计算部门 AWS 内部成立了一个新的团队,专注于开发智能代理 AI。 这种系统旨在帮助用户自动化生活中的某些任务,从而提高效率和便利性。 AWS 的首席执行官马特・加尔曼在一封发给员工的邮件中表示,智能代理 AI 有潜力成为 AWS 下一个数十亿美元的业务。
3/5/2025 9:34:00 AM
AI在线

PayPal 推出智能代理工具包,助力AI与支付API无缝连接

PayPal 近日发布了全新的智能代理工具包(Agent Toolkit),旨在帮助开发者将 PayPal 的 API 套件与人工智能(AI)框架结合起来。 通过采用模型上下文协议(Model Context Protocol,简称 MCP),这一工具包为支付、发票、纠纷、发货追踪、目录管理、订阅和分析等功能提供了便捷的 API 接入。 MCP 是一项由 Anthropic 提出的标准,旨在规范智能代理如何访问第三方服务和数据源。
4/29/2025 3:00:40 PM
AI在线

信用卡巨头 Visa 押注 AI 代理:未来 AI 将自主管理你的消费

信用卡巨头 Visa 正式进军人工智能代理领域。 该公司周三宣布,将与包括 OpenAI、微软和 Anthropic 在内的多家领先人工智能开发商合作,将其庞大的支付网络与他们的人工智能系统连接起来。 这项名为“Visa 智能商务”的计划旨在让自主人工智能模型(即“代理”)能够根据用户的预算和偏好,自主完成从食品杂货到服装等各种商品的购买。
5/6/2025 10:01:19 AM
AI在线

未来两年,AI Agent 部署将增长 327%

据最新的 Salesforce 全球调研显示,全球人力资源高管(CHRO)计划在未来两年内大幅扩展数字劳动力,特别是人工智能(AI)代理的部署,以提升生产力。 这项研究对200名全球人力资源高管进行了调查,结果显示,他们一致认为 AI 代理将深刻改变组织结构。 图源备注:图片由AI生成,图片授权服务商Midjourney调研结果指出,77% 的受访者相信,AI 代理将成为未来劳动力的重要组成部分。
5/6/2025 11:00:51 AM
AI在线

IBM 首席执行官进军人工智能市场并加大美国投资

在最近的一次采访中,IBM 首席执行官阿尔温德・克里希纳(Arvind Krishna)表示,随着人工智能(AI)市场竞争的加剧,IBM 正计划通过提供能够整合客户使用的不同 AI 代理的工具,来提升其在该领域的销售。 这些工具将帮助客户管理他们在关键业务应用中的一系列 AI 代理,主要包括 Salesforce、Workday 和 Adobe 等公司的产品。 克里希纳指出,IBM 将助力客户构建适合未开发用例的 AI 代理,客户只需在五分钟内完成创建。
5/6/2025 6:00:51 PM
AI在线

Parloa融资1.2亿美元,市值突破10亿美元,欲扩展企业AI客服平台

近日,客户体验领域的创新公司 Parloa GmbH 宣布成功融资1.2亿美元,使其估值达到10亿美元。 这笔新资金将用于加速公司在北美和欧洲的扩张,增强其人工智能代理管理平台,并招聘国际人才。 自2018年成立以来,Parloa 专注于为企业提供 AI 驱动的客户服务解决方案。
5/7/2025 3:00:44 PM
AI在线

微软采用谷歌的A2A标准,连接AI代理

微软宣布将支持 Google 推出的开放协议 ——Agent2Agent (A2A) 标准,旨在促进人工智能(AI)代理之间的相互通信。 通过这一协议,微软计划在其两个 AI 开发平台 Azure AI Foundry 和 C o p i l o t Studio 中引入 A2A 的支持,同时加入 GitHub 上的 A2A 工作组,积极参与协议的制定和工具的开发。 图源备注:图片由AI生成,图片授权服务商Midjourney在一篇博客文章中,微软表示:“通过支持 A2A 并基于我们的开放式编排平台进行构建,我们正在为下一代软件奠定基础,这些软件在设计上具备协作性、可观察性和自适应性。
5/8/2025 9:00:44 AM
AI在线

WisdomAI 斥资2300万美元推出创新商业智能平台,重塑企业数据洞察 ​

WisdomAI 近日正式发布,并获得了230万美元的融资,由 Coatue Ventures 领投,Madrona、GTM Capital 和 The Anthology Fund 参与。 WisdomAI 的目标是解决传统商业智能工具的局限性,推出了首个 Agentic 数据洞察平台,帮助企业从分散的数据生态系统中获取主动、上下文相关且即时的洞察。 许多财富100强企业,如思科和康菲石油,已经开始使用 WisdomAI,挖掘那些被数据孤岛掩埋、延迟在仪表盘上或卡在过时报告系统中的深层洞察。
5/8/2025 5:00:57 PM
AI在线

疯狂更新!Cursor年内放大招!强势推出后台多代理并行!顺利飞升真·多项目高效协作神器!统一简单定价!网友:下一个级别的产品

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)12个小时前,Cursor给出了一波有力的回击! 简化定价逻辑、后台并行代理、多代码库工作区、聊天markdown导出、新Tab模型……这波 Cursor 0.50的更新,堪称年内最重磅。 要问AI编码产品如何演进?
5/11/2025 11:33:49 PM
云昭
  • 1