AI在线 AI在线

我们一起聊聊聊聊智能体的基础架构

2023年下半年,智能体这个概念开始随着AI的突进式发展而被很多人关注起来。 到了2024年,大模型的能力进一步增强,为智能体快速发展提供了底层能力支撑。 随着2025年DeepSeek的爆火,智能体在各行各业的落地应用案例开始明显增加。

2023年下半年,智能体这个概念开始随着AI的突进式发展而被很多人关注起来。

到了2024年,大模型的能力进一步增强,为智能体快速发展提供了底层能力支撑。

随着2025年DeepSeek的爆火,智能体在各行各业的落地应用案例开始明显增加。

大家已经不再满足于单一功能的智能体,而是开始追求通用智能体甚至AIGC的能力,Manus是这个趋势下的一个典型案例,除此之外还有字节的扣子空间,以及百度的心响APP。

回看过去十年移动互联网的爆发,支撑移动互联网的土壤,其实是3G、4G通信网络的支撑,以及智能手机行业的蓬勃发展。从中我们不难得出一个结论:软件生态要想发展得足够庞大,需要底层硬件和基础设施的支撑。

在AI领域,这个论断依然成立,这也是写这篇文章的原因:智能体(甚至是AIGC)的发展甚至构建生态,背后需要的基础设施建设是重中之重。Agent Infra是Agent落地的关键,因为它涵盖了Agent从开发到部署的完整生命周期。

从我查阅的很多资料来看,目前在Agent Infra层面,大致可以划分为如下四个领域,分别是:

  • Environment:提供Agent开发和运行环境,相当于给了Agent一台可自行操作的计算机。
  • Context:为Agent有效运行提供所需的信息,包括任务相关的背景知识和工具的使用方法。
  • Tools:使Agent能便捷调用和协作的各类工具,包括各种类型的插件,以实现多样化的任务。
  • Agent Security:以Agent-native的方式保障Agent的行为与数据在执行过程中的安全与合规。

一、Environment

Environment,即我们所熟知的运行环境(操作系统和服务部署运行容器),它为Agent提供了开发和部署环境,可以让Agent更好地完成端到端的任务。目前在AI领域,比较突出的路径有两种,分别是Sandbox和Browser:

1、Sandbox是一种安全机制,为执行中的程序提供隔离环境。传统的虚拟机并不能很好地满足Agent需求,因为Agent对虚拟机的性能提出了更高的要求,比如需要更高的隔离性、更快的启动速度、更强的稳定性,以及具备一定的AI性能。

2、浏览器是Agent最重要的工作环境之一,浏览并操纵网页的能力也将成为Agent的核心能力之一。Browser Infra赋予Agent的能力大致可以分为两类:1-让Agent可以大规模浏览网页;2-使Agent可以操纵网页。

最典型的案例就是Manus,它的运行环境主要基于Linux Sandbox,借助无头浏览器来完成任务。

二、Context

目前无论是ChatBot还是Agent,都需要人主动描述需求(提示词),但信息幻觉问题是困扰人和AI协作的最大挑战。除此之外,大模型、智能体之间的协作交互问题,也是另一大挑战。

1、当下最有效的缓解AI信息幻觉的方法就是RAG,因此,RAG方法也可以视作Agent Infra领域很重要的一个组成部分。目前,RAG已成为一种共识性的技术,并在各类应用场景广泛使用。

Agentic RAG系统能够持续分析Context和用户意图,自主从多种来源检索并整合相关信息,使Agent可以更好地完成任务。

2、大模型和智能体之间,系统内部和外部之间的协作调用,目前已经出现了一个标准化的解决方案,即MCP。MCP是Anthropic发布的一个开放式协议,重新定义了Agent调用外部工具、获取数据以及与各类服务交互的方式。

三、Tools

Tools的价值不言而喻,可以让Agent能够便捷调用各类工具,实现多样化的任务。随着Agent交互复杂度的不断提升,相关的Infra使工具层正在快速扩张。在Tools Infra层面,较为通用的有如下三个方向的工具:

1、搜索:搜索是Agent获取外部信息的重要途径。相比我们手动利用搜索引擎去检索信息,Agent会进行更频繁、更复杂的搜索,且传统搜索引擎无法满足Agent的搜索需求。因此,Tools Infra搜索领域需要解决两大难题:1-更快且低成本的信息检索;2-更智能的搜索和爬虫架构(解决人为造成的信息闭塞问题)。

2、支付:如前面为大家介绍的AI落地核心因素所说,确定性的场景是AI落地的前置条件,而金融、法律等领域天然具备这样的条件。因此,金融领域未来会成为Agent落地的重要场景,而金融领域最重要的属性就是Finance & Payment,即资管和支付。

3、工作流:工作流大家并不陌生,在IT软件开发领域,工作流的概念其实大家日常都在实践,最典型的就是CICD持续交付流水线。在AI领域,工作流也是很重要的一项基础设施,特别是对于一些很复杂的任务,让AI自定义工作流来进行决策和执行任务,最终的结果很难保证符合预期。

当然,工作流也分为前后端,比如Manus的在线可视化任务执行,其实就是Frontend Workflow(前端工作流);像字节扣子空间的专家Agent,其实背后也需要Backend Workflow(后端工作流)来支撑。

四、Agent Security

随着Agent能力边界的拓展,安全性上的要求也在同步提升,最核心的就是信息安全。因为大模型的训练需要投入大量的数据,且AI本身会检索互联网上大量的数据并输出结果,我们需要保证自己的敏感信息不被泄漏,也希望AI给出的结果符合信息安全法规。

我们需要对Agent进行身份验证,并保证Agent的每个意图和行动都是安全的。此外,Agent每次数据交互都需要动态校验,这也对数据安全提出了更高的要求。不过安全领域一向遵循“需求驱动”的逻辑,即先有成熟的下游产品设计,再有对应的安全问题与解决方案。安全问题,先天的禀赋就是后知后觉的后来者。

相关资讯

硬核分享!构建单智能体已经Out了!大佬分享:架构设计如何推动可靠的多智能体编排

作者 | Nikhil Gupta,Atlassian AI产品管理负责人编译 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)时至今日,如果再提如何构建一个Agent,肯定已经过时了。 打造一个超级智能的单一模型已经不再是2025年的主旋律。 而真正的力量和令人兴奋的新领域,是让多个专业化的AI智能体协同运转起来。
5/28/2025 6:04:20 PM
云昭

AI 赋能!Spring Boot 封装智能模块,轻松实现自动化

在当今数字化时代,人工智能(AI)正以前所未有的速度深入各个行业,成为提升企业竞争力和优化用户体验的重要驱动力。 无论是智能客服、自动文本生成,还是数据分析和预测,AI 的应用场景正变得越来越广泛。 对于开发者而言,如何高效地将 AI 技术集成到业务系统中,是一个至关重要的问题。
2/8/2025 8:16:16 AM
路条编程

一文读懂DeepSeek-V3 技术报告

2023年7月17日,DeepSeek正式成立,由幻方量化提供资金支持。 梁文锋凭借其在金融和AI领域的深厚背景,带领团队开始探索生成式AI技术。 同年11月2日,DeepSeek推出首款开源模型DeepSeek Coder,支持多种编程语言的代码生成、调试和数据分析任务,为AI领域的应用奠定了基础,直到 2024 年 12 月,DeepSeek-V3的发布引发了行业震动和社会广泛关注,在他们的最新技术报告《DeepSeek-V3技术报告》中,团队详细介绍了其最新成果——DeepSeek-V3模型。
2/12/2025 8:30:18 AM
FlerkenS
  • 1