AI在线 AI在线

AI Agent重塑微服务治理

1.项目背景传统场景下,软件的研发主要依靠人,需求沟通、开发、测试、部署等阶段都需要大量人力投入。 大模型优秀的代码生成和一定的思维链推理能力,能够激发微服务研发、运维等环节“智能涌现”,重塑软件研发全生命周期。 商业产品包含效果广告(搜索广告,信息流广告)和展示广告(品牌广告,开屏广告)两大类广告产品,以及基木鱼和观星盘、电商等营销工具。

1.项目背景

传统场景下,软件的研发主要依靠人,需求沟通、开发、测试、部署等阶段都需要大量人力投入。大模型优秀的代码生成和一定的思维链推理能力,能够激发微服务研发、运维等环节“智能涌现”,重塑软件研发全生命周期。

商业产品包含效果广告(搜索广告,信息流广告)和展示广告(品牌广告,开屏广告)两大类广告产品,以及基木鱼和观星盘、电商等营销工具。为了保障复杂系统的稳定性,业务同学需投入大量人力运维微服务,从而保证业务功能快速交付和线上高稳定性。这些工作包含两类:

  • 常规流程操作:日常上线部署、调整部署和发布 API、配置修改、路由参数更改等常规操作。
  • SRE架构优化:技术栈持续升级,针对线上报警等稳定性问题,进行深层次的根因定位和故障处理、架构优化。

平台工程团队面向商业产品打造的 Jarvis 平台,提供了一整套的运维工具包括自动化部署和微服务治理分析能力。但是这些治理工具存在以下问题:

图片图片

  • 组合操作复杂:完成单一目的需要大量的组合操作,这些操作入口深(隐藏在重重菜单中),链路长。
  • 强依赖人工经验:对于根因定位和故障处理、架构优化, Jarvis 平台开发了微服务治理、性能分析、自动化监控、调用链分析等高阶能力。但是这些工具使用门栏较高,定位问题严重依赖于人工经验。如果对该业务应用无运维经验,则需要耗费大量时间去定位止损和优化架构。

图片图片

为了提升商业产品维护的效率问题,Jarvis 平台使用 AI 原生应用思维来全新重塑产品形态,革命性提升业务研发运维效率,基于多智能体架构将专家经验内化,大幅降低使用门槛,显著提升微服务维护的效率(包括故障处理和根因定位、架构优化、部署操作等)。

主要有两个关键环节:

  • 全流程对话式交互:用户依靠自然语言发出指令,多轮持续对话完成一项完整的升级操作,比如灰度发布、配置限流熔断、流量录制和回放等复杂操作。
  • LLM 推理诊断处理:基于定位问题的经验,依靠LLM的推理能力,进行根因分析,通过智能诊断、报警等机制来驱动系统故障的高效处理,实现人工运维经验的可复制性。

图片

2.效果演示

应用使用JarvisBot 升级到jdk17(全流程对话式交互)

  • 用户要求升级 JDK17;
  • DirectorAgent解析SOP规划执行路径,组装CoderAgent、OpsAgent解决该需求;
  • CoderAgent自动升级代码并发出CR;代码负责人 CR 合入;
  • OpsAgent部署上线,并将录制流量回放保证服务正常,承接线上流量;

AI Agent重塑微服务治理

基于思维链推理的报警处理(LLM 推理诊断处理)

  • 用户要求诊断错误日志报警;
  • DirectorAgent解析 SOP 规划执行路径,组装DiagnosisAgent、OpsAgent解决该问题;
  • DiagnosisAgent拉取 Metrics 日志和 Tracing 日志定位到问题实例,提出”屏蔽实例“优化建议;
  • 用户确认后,OpsAgent执行优化止损操作;

AI Agent重塑微服务治理

3.基于SOP的多智能体协作

3.1 业界探索

图片图片

单个AI智能体=LLM+记忆+规划+工具等,参考述上OpenAI理论基础。

 多智能体则需要由多个Agent依靠既定SOP互相进行交流,从而保证智能体能够正确的合力完成一个复杂的长程任务。智能体的关键在于SOP,是不同工种技能的关键,能让每一个智能体扮演一个特定角色。

SOP指的是Standard Operating Procedure,即标准操作程序,它提供了执行特定任务所需涉及的角色分工和详细操作步骤,以确保在不同情况下都能保持作业结果的准确性和高效性。SOP 在软件开发、系统维护和团队协作中起着重要作用,有助于确保开发人员遵循最佳实践、减少错误和提供工作效率。

为了解决项目开篇提到用户需求,系统为了快速产出大量的能力,因此经过多次迭代,有了一系列演进:

△SOP架构演进△SOP架构演进

阶段一:多智能体协作。Agent 之间需要相互调用才能完成复杂的对话目标。但是Agent 的工作存在大量重复,比如几乎所有智能体都需要调用底层的 API agent进行数据查询,诊断的智能体其实也需要大量的优化操作。智能体直接的边界非常不清晰,交互的方式也比较多样,有通过自然语言,有通过直接调用的,非常混乱。

图片图片

阶段二:智能体协作SOP 标准化。通过标准操作程序(SOPs)编码作为智能体Prompt,指导大模型按照结构化流程工作并协调智能体各个环节,允许具有领域专长的智能体验证输出并减少复合错误,有效避免大模型的幻觉问题。SOPs 总结人工操作流程经验,从而让 agent 的职责和产出结果标准化、agent 间的协作完全符合要求。

3.2 SOP格式定义

问题场景

SOP

自然语言描述的场景

自然语言描述的操作步骤

举例:

问题场景

SOP

错误日志报警诊断分析

1:信息收集,收集要诊断排查的所有相关数据和信息

2:分析诊断,分析诊断具体的原因

3: 止损建议,根据诊断原因给出止损建议

信息收集

1. [TOOL]查询错误信息详情,获取结果列表中第一条数据traceId, stack_error_message, localBns

2. [TOOL]查询错误日志信息,获取traceId相关联的所有日志信息

分析诊断

1. [TOOL]分析错误日志信息,根据日志信息总结错误根因

2. [TOOL]分析错误信息详情,根据错误信息的描述和stack_error_message分析错误原因

止损

1. [TOOL]查询止损建议,根据诊断原因查询止损建议

4.多智能体架构落地实践

图片

JarvisBot是一个中枢神经模块,做决策和触发任务,不做具体的业务逻辑。它链接用户(LUI层)和业务层,跟用户进行自然语言的交互,理解自然语言描述的SOP ,指挥底层系统完成对应的任务。它的几个重要部分包括:

  • Agents(智能体集合):包含DirectorAgent(技术负责人)、CoderAgent(程序员)、OpsAgent(操作智能体)、DiagnosisAgent(诊断智能体)等一系列智能体。

智能体都基于 BaseAgent 构建,具有基础的 SOP 理解和LLM ReAct 思维链规划能力。

△Agent基座框架△Agent基座框架

不同的 Agent 具有不同的技能,比如DirectorAgent规划智能体工作流、CoderAgent监听PRD生成代码,DiagnosisAgent监听诊断类问题产生诊断结论等。

Agents之间通过消息总线进行交互,不同的 Agent 产生和订阅不同主题的消息。

  • 知识管理端:管理各种静态数据,并提供一定的自动化手段进行更新。比如借助数据飞轮管理和优化Prompts,录入并管理 SOP,自动化录制知识。
  • 工具集合:链接底层业务接口,封装一些复杂操作,通过HTTP或者 RPC 请求获取业务模块的数据。
  • 模型管理:对模型一些的封装管理,包括一些重试策略、排队算法等。

下图是一个典型的基于 SOP解决诊断问题的流程图:

图片图片

5.数据飞轮驱动多智能体架构持续进化

既然SOP是驱动多智能体协作的关键,如何持续产出 SOP 是让多智能体架构真正具有自主进化的能力关键。如何产出 SOP依赖于数据提炼的能力。因此:如何构建数据飞轮并且利用数据飞轮持续优化提炼SOP, 是实现多智能体持续进化的关键。

图片图片

5.1 大小模型飞速协同进化,是智能性进化的根基

智能体架构底层依靠一系列不同尺寸的模型。其中通用大模型用于通用知识理解和复杂推理,轻量级模型用于SFT 微调。

图片图片

上表看出,模型尺寸越小,成本越低、响应速度越快,但是通识能力和复杂问题推理能力就越来越差。

JarvisBot智能体的核心思路是用大模型教会小模型,借助大模型去构建小模型SFT训练优质数据集,在不同细分场景大量的使用小模型,从而达到智能性和成本的完美平衡。

△不断剪裁模型尺寸△不断剪裁模型尺寸

△大模型教会小模型△大模型教会小模型

△大小模型协同进化架构△大小模型协同进化架构

基于离线AI 对话评估系统利用规则库、参考历史相似语料打分、语料聚类抽样、多LLM(文心4、GPT4、专精SFT模型等)群体智能打分,评估线上对话语料。单日机器可自动完成评估对话条目4w+,产出大量的评估报告推动JarvisBot从产品、LUI技术解析和模型基座多个角度飞速进化。

图片图片

5.2 如何实现持续进化—数据飞轮训练专家模型,自动提炼SOP

通过自动化评估系统,可以不断评估智能体的智能性,不断洞察用户的需求,包括产品功能使用情况、未满足的功能诉求、用户习惯操作动线等。借助数据飞轮可以不断训练出专家模型,自动提炼SOP,从而帮助多智能体不断的持续进化。

图片图片

6.AI Agent微服务治理平台Jarvis总结

图片图片

相关资讯

Gartner:超 40% 的 AI Agent 智能体项目活不过两年

Gartner最新报告显示,超过40%的AI Agent项目因商业利益不佳或误用炒作,预计将在2027年底前消失。调查发现,仅19%的企业对AI智能体进行了大量投资,而42%持保守态度。#AI技术##商业投资#
6/29/2025 11:36:29 AM
漾仔

全网爆火的Manus到底能做什么?超多演示案例来了!

关注科技 AI 圈的同学,在 3 月 6 号这天都被 Manus 刷屏了,那么他是个啥呢? 和 DeepSeek 和 Open AI 有什么区别呢? Manus 官网上是这样说的“Manus 是一个通用的人工智能代理,它连接思想和行动:它不仅会思考,还会提供结果。
3/11/2025 12:54:46 AM
益达

速通BOSS需求!零基础AI Agent高效工作流设计指南

此次会连载一套 AI-Agent 构建的系列,主要分为三部分,首先是速通 AI-Agent 构建的工作流基础,然后是通过 ComfyUI 作为案例来复盘如何快速上手工作流平台,最后则是借助 Agent 平台构建一个 AI Agent 案例,本系列意图主要是帮助大家贯通工作流的搭建形式,并尝试思考为自己的工作搭建一些可用的 AI 助手,或是提供构建的方法指引。 无论你是产品经理还是设计师,你会发现商业场景的 AIGC,几乎都没有办法通过一段需求描述或是简单的 Agent 对话就搞定的,你需要更专业更复杂的 AIGC 过程,那么如何理解复杂? 实现专业?
3/18/2025 8:22:14 AM
泡泡bing

唯有惊叹!一手体验首款通用Agent产品Manus

一个新团队突然发了一个首款通用型的项目:Manus。 演示在此,我人直接看麻了。 看完我的第一感觉,人类又要一败涂地了。
3/7/2025 7:43:25 AM
数字生命卡兹克

速通BOSS需求!零基础AI Agent高效工作流设计指南(二)

前言. 此次会连载一套 AI Agent 构建的系列,主要分为三部分,上篇是速通 AI Agent 构建的工作流基础,本篇则是通过 ComfyUI 作为案例来复盘如何快速上手工作流平台,给大家提供一些思路与窍门,下篇则是借助 Agent 平台构建一个 AI Agent 案例,本系列意图主要是帮助大家贯通工作流的搭建形式,并尝试为自己搭建一些可用的 AI 助手,或是提供构建的方法指引。 上期回顾:.
5/13/2025 2:16:53 AM
泡泡bing

这篇 AI Agent 漫游指南,带你建立全面的科技史观

作者 | kong以OpenAI o1与DeepSeek R1为代表的"类Agent"模型、OpenAI DeepResearch为代表的“真Agent”模型,正在重构AI Agent的技术范式。 Agentic Workflow的王座还没坐热,强化学习驱动的端到端Agent模型训练已呼啸而来。 未来趋势已指明:模型即产品,工程化Agent的命运将如何?
5/27/2025 10:05:00 AM
腾讯技术工程

模型吞噬代码,Agent重构世界:当AI Agent与模型协同进化

大家好,我是肆〇柒。 AI 圈的进化速度之快,已是不争的事实。 去年,MCP(模型上下文协议)发布,随后 AI Coding 赛道愈发热闹,Cursor、Cline、Devin、MGX 等产品层出不穷。
5/29/2025 9:57:38 AM
肆零柒

AI Agent!一个万亿市场正在觉醒

"你能帮我订个周末的餐厅吗? " 这句话,你可能每周都要说一遍。 打开手机,搜索餐厅,对比评分,查看菜单,打电话预订...整个流程下来,至少要花15分钟。
6/11/2025 3:00:00 AM
大数据AI智能圈

Lovart国产版超全测评!10分钟做了我一周的工作量!

嗨大家好! 今天是星流 AI 操作员阿真! 之前我有分享过 Lovart 也就是第一个设计 Agent,整合多种 AI 模型来一站式完成概念到成品的创意过程。
7/7/2025 12:30:19 AM
阿真Irene

不用写产品文案了!手把手教你用Coze搭建设计AI助手​

文案是产品与用户沟通的最直接的桥梁,也是影响用户理解和行为决策的关键。 此前,各业务都陆续建立了自己的语义规范。 怎样让静态的语义文档,变成日常工作中随手能用的一个工具,是推进规范应用的重要环节。
7/18/2025 2:14:11 AM
58UXD 团队

碾压ChatGPT Agent:深度测评国产AI智能体神器MiniMax Agent

上周五,ChatGPT Agent mode 上线了。 之前一直有点偷懒,也嫌贵,嫌麻烦,没咋做 Agent 的对比,这次真的想好好评测一下,让我自己有一个认知,于是花了一天的时间,构建了一些我自己的任务。 拿去测一下各家通用 Agent 的情况。
7/24/2025 12:16:19 AM
数字生命卡兹克

Agent KB:经验池让Agents互相学习!GAIA新开源SOTA,Pass@1性能最高提升6.66

近日,来自 OPPO、耶鲁大学、斯坦福大学、威斯康星大学麦迪逊分校、北卡罗来纳大学教堂山分校等多家机构的研究团队联合发布了 Agent KB 框架。 这项工作通过构建一个经验池并且通过两阶段的检索机制实现了 AI Agent 之间的有效经验共享。 Agent KB 通过层级化的经验检索,让智能体能够从其他任务的成功经验中学习,显著提升了复杂推理和问题解决能力。
7/25/2025 3:57:00 PM
机器之心

阿里国际Marco获SAIL奖!日调用量破10亿次,翻译准确率领跑行业

在近日公布的2025世界人工智能大会卓越人工智能引领者SAIL奖评选中,阿里国际跨境电商AI解决方案Marco成功斩获SAIL之星奖项。 据阿里国际透露,公司AI服务调用量持续攀升,平均日调用量已突破10亿次。 生态开放成效显著通过技术共享策略,阿里国际已向集团外生态伙伴开放AI服务能力。
7/28/2025 4:52:11 PM
AI在线

解构GoldMine OS:AI Agent如何破解RWA“不可能三角”

大家好,我是肆〇柒,随着《香港稳定币法案》从提出到8月1日即将生效,合规稳定币的发行与交易框架首次在香港获得法律背书,这不仅为传统资产上链提供了清晰的监管路径,也让“链上数字货币的规模化合规交易”从概念走向现实。 在这一里程碑事件的背后,市场目光重新聚焦于RWA(Real-World Asset)代币化——如何让黄金、债券、房产等传统资产在区块链世界中焕发新生? GoldMine OS给出了一个惊艳答案。
8/1/2025 1:00:00 AM
肆零柒

AI Agent哪个更好用?12个角度全方位深度分析Dify、N8n、Coze三大工具

在数字化转型的浪潮中,AI Agent 工具正成为企业提升效率、优化流程的关键利器。 然而,面对众多选择,如何挑选最适合的工具成为了一个难题。 本文将深入剖析 Dify、N8n 和 Coze 这三款热门 AI Agent 工具,从功能、价格、学习成本、技术架构到实际应用场景,全方位对比它们的优劣,帮助你在选型时避坑,找到最适合自己的工具。
8/8/2025 7:29:52 AM
A ad钙

第一波!2025年8月精选实用设计干货合集

大家好,这是 2025 年 8 月第一波干货合集! 这期干货合集几乎全都是 AI 工具,有基于 AI 的着陆页生成工具,有给 Blender 做的 AI 助手,有免费生成粉色壁纸的 AI 网站,有免费且具备 AI 功能的在线设计平台,有基于 AI 的 Github Readme 文档生成工具,还有一键生成可交互页面的 AI 平台。 当然,在继续阅读下去之前,记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:.
8/11/2025 7:35:54 AM
陈子木

AI Agent哪个更好用?12个角度深度对比测评三大知名工具

在数字化转型的浪潮中,AI Agent 工具正成为企业提升效率、优化流程的关键利器。 然而,面对众多选择,如何挑选最适合的工具成为了一个难题。 本文将深入剖析 Dify、N8n 和 Coze 这三款热门 AI Agent 工具,从功能、价格、学习成本、技术架构到实际应用场景,全方位对比它们的优劣,帮助你在选型时避坑,找到最适合自己的工具。
8/8/2025 7:29:52 AM
A ad钙

如果有一个能替你操作手机的Agent,你会用它做什么?

往期作者干货:如果你有一个能替你操作手机的 Agent,你会用它来做什么? 替自己回复微信消息? 下单中午想吃的外卖?
8/23/2025 12:28:55 AM
一泽Eze
  • 1