AI在线 AI在线

智能体

GPT-5点赞!八大顶尖机构发布「自进化智能体」全面综述

LLM驱动的AI智能体已展现出惊人潜力:它们以LLM为核心,集成感知模块(处理文本/图像/音频/视频)、规划模块(如链式思考CoT或树式思考ToT)、记忆模块(短期上下文存储与长期知识检索)和工具模块(调用API如搜索引擎或代码执行器)。 在单智能体系统中,这些组件协同工作,处理从网页导航、代码生成、投资辅助到生物医学分析的任务。 而在多智能体系统(MAS)中,智能体间通过协作(如辩论或任务分解)攻克复杂问题,模拟人类团队的群体智能。
8/21/2025 2:14:17 PM
新智元

智能体防御 | 一文了解三种系统提示词加固方法

概述智能体的系统提示词加固是指通过优化,补充,约束系统提示词的内容和结构,增强其对模型“约束力”和“指导性”,让智能体在收到用户的请求时通过安全研判后来决定返回的内容,确保模型在复杂场景下行为可控、安全合规、效果稳定。 不同约束的效果可能因“模型类型”、“应用场景”而异,本方案旨在为系统提示词加固提供指导,确保约束在多种情境下的适用性。 系统提示词的加固效果受到多种因素的影响,例如“模型类型”、“系统提示词的长度”,“加固内容在系统提示词中的位置”以及“添加的加固类型数量”等。
8/21/2025 7:35:26 AM
字节跳动技术团队

百度文库网盘发布GenFlow2.0,支持同时调用超100个专家智能体

8月18日,在百度AI Day开放日上,百度文库联合百度网盘发布全球首个全端通用智能体「GenFlow2.0」。 该产品支持超100个专家智能体同时干活,3分钟并行完成超5项复杂任务,生成速度超主流同类型产品10倍,率先做到「分钟级交付、过程可干预、记忆可追溯」。 目前,GenFlow2.0已经正式在百度文库Web端、APP端上线,无需排队、邀请码,所有用户均可以直接使用。
8/18/2025 4:58:44 PM

目标驱动而非任务序列:Agentic AI重塑业务流程自动化范式

大家好,我是肆〇柒。 我看到一项来自意大利特伦托大学工业工程系,以及意大利国家研究委员会IASI研究所的前沿研究。 随着企业AI落地实践的深入,我们正见证一个显著趋势:从传统预定义工作流模式向Agentic AI范式的转变。
8/18/2025 9:16:49 AM
肆零柒

微软推Agent Lightning:AI 智能体训练与执行彻底解耦,零改代码即用!

近日,微软研究院的一个团队发布了一个名为 Agent Lightning 的框架,它使任何人工智能(AI)智能体都能通过强化学习进行训练。 图片这个框架的核心突破在于,它实现了智能体执行与强化学习(RL)训练过程的完全解耦。 这一设计允许开发者将该框架无缝集成到他们现有的智能体中,并且几乎不需要修改任何代码。
8/18/2025 3:00:00 AM

智能体“模态之战”:谁将主宰云基础设施管理“AIOps”的未来?

大家好,我是肆〇柒。 云基础设施日益复杂,智能体能否真正成为DevOps工程师的得力助手? AI 应用于生产系统运维是行业在持续探索的领域,我看到一篇由密歇根大学、UC Berkeley、安德森·霍洛维茨等机构的联合研究《Cloud Infrastructure Management in the Age of AI Agents》,其中深入分析了智能体在SDK、CLI、IaC和ClickOps四种云管理模态中的实际表现。
8/14/2025 9:38:16 AM
肆零柒

微软发布五大AI Agent模式:一键解锁AI员工,打造智能体工厂

今天凌晨,微软在官网发布了Agent常见的设计模式和用例,以帮助用户快速开发出功能强大的自动化AI员工。 与传统的RPA、自动化脚本相比,智能体除了提供自动化之外,还能根据实际业务场景进行推理、协作、弥合知识与成果之间的差距,挖掘出全新的见解,提供更高的商业价值。 以下是微软根据实际业务场景总结出的5种常用的Agent模式:1、工具使用模式如今的智能体能直接与企业系统交互,能检索数据、调用应用程序编程接口(API)、触发工作流和执行交易。
8/14/2025 9:15:00 AM

AI 智能体的三大支柱:上下文、认知与行动

当我们向AI助手下达“分析客户流失情况并向销售团队发送警报”的指令时,多数聊天机器人只会解释客户流失的定义,或建议联系数据团队;而真正的AI智能体却能主动访问客户数据库、开展分析、识别高风险账户,并自动通知相关销售人员——全程无需人工干预。 这种差距不仅是能力的差异,更源于架构的本质区别。 语言模型擅长文本理解与生成,但智能体的核心优势在于三大支柱的协同运作:理解场景的“上下文层”、做出明智决策的“认知层”,以及将决策付诸实践的“行动层”。
8/14/2025 8:20:38 AM
大模型之路

随着智能体工具兴起,银行业加速AI部署

Evident Insights上周发布的AI报告显示,今年上半年,随着智能体工具在该领域开始崭露头角,银行加大了AI的应用力度,分析发现,全球50家最大的金融企业推出的新应用案例数量,较2024年下半年翻了一番,从事自主式AI研究的技术人员数量增长了十倍以上。 Evident表示,在所分析的银行部署的173个应用案例中,超过半数都利用了GenAI的能力,50家企业中有9家记录了处于试点或生产阶段的智能体,但纽约银行、第一资本和摩根大通是仅有的三家披露了智能体工作流支持架构细节的企业。 报告称,银行正努力实现双重目标。
8/13/2025 11:14:47 AM
Matt

关于智能体管理权的四点思考

随着智能体不断普及,并从试点阶段迈向生产阶段,我们需要将关注点从智能体构建平台转向AI编排平台和AI治理、风险与合规管理平台。 随着智能体自主性的提升,企业内诸如IT和人力资源等部门应如何管理它们,以及应如何对待它们,这些问题也接踵而至。 智能体正日益深入地融入企业流程,关于它们可能如何开始侵蚀长期存在的SaaS模式的争论也日益增多。
8/13/2025 7:15:00 AM
Nicholas

2025 年多款 Deep Research 智能体框架全面对比

作者:fangzlong随着模型的范式和工程方式发展,网络上涌现出了一大批模仿人类研究者对问题进行深入研究的智能体应用。 本文将从 OpenAI 关于 DeepResearch 的指南开始,通过几个开源框架的架构解构与功能映射,揭示不同框架在研究自动化领域的差异。 为各位使用者、开发者选择合适工具和框架提供系统化参考。
8/12/2025 8:58:03 AM
腾讯技术工程

第一波!2025年8月精选实用设计干货合集

大家好,这是 2025 年 8 月第一波干货合集! 这期干货合集几乎全都是 AI 工具,有基于 AI 的着陆页生成工具,有给 Blender 做的 AI 助手,有免费生成粉色壁纸的 AI 网站,有免费且具备 AI 功能的在线设计平台,有基于 AI 的 Github Readme 文档生成工具,还有一键生成可交互页面的 AI 平台。 当然,在继续阅读下去之前,记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:.
8/11/2025 7:35:54 AM
陈子木

告别上下文溢出:MemTool如何优化LLM智能体的工具记忆管理

大家好,我是肆〇柒。 近期,普华永道(PricewaterhouseCoopers)商业技术与创新办公室的研究团队在LLM智能体技术领域取得了一些成果,他们提出的MemTool框架为解决多轮对话中动态工具调用的短期记忆管理问题提供了系统性解决方案。 关键发现包括:推理型LLM在自主代理模式下可实现90-94%的工具移除效率工作流和混合模式实现了跨模型一致的高移除效率(90% )工具移除效率与任务完成率存在解耦特性,需根据场景权衡选择系统提示工程和模型选择对MemTool性能有决定性影响在构建智能对话系统时,你是否遇到过这样的困扰:当LLM 智能体与用户进行多轮对话时,随着对话轮次增加,系统不断加载新工具却无法有效清理旧工具,导致上下文窗口迅速饱和,最终影响对话质量和系统稳定性?
8/8/2025 2:06:48 PM
肆零柒

GPT-5,AI的「登月时刻」来了!奥特曼现场发布,三位一体博士级智能体

刚刚,万众期待的GPT-5正式发布! 发布会仅仅20分钟后,我们断定,这就是「AI的登月时刻」。 GPT-5不仅仅是GPT-4的版本迭代,GPT-5是一场真正的智能范式跃迁!
8/8/2025 9:29:29 AM

AI 智能体记忆机制详解

是否总感觉你在和 AI 助手重复着同样的对话? 你告诉它一些重要的事情,五分钟后,它就忘了。 很长一段时间以来,这就是和大多数 AI 进行对话的现实情况。
8/8/2025 2:15:00 AM
Baihai IDP

GPT-5 的可读性革命,从博弈到智能体的跃迁

GPT-5 发布在即,根据奥特曼在内部演示中首次披露的 GPT-5 实测数据,这一代模型不仅具备高达 256K 的上下文窗口,还展现出惊人的数学与编程能力。 更令人瞩目的是其“智能模式切换”能力——在深度推理与快速响应之间自由切换,仿佛具备了某种“元认知”能力。 这种表现并非偶然,而是源于其底层架构中引入了新的验证机制,被称为“Universal Verifier”,其灵感正是来自一项前沿研究:Prover-Verifier Game(PVG)。
8/7/2025 2:55:00 AM
波动智能

智能体将吞噬SaaS市场?专家意见两极分化

随着对智能体的炒作达到新高度,一种新兴理论认为,突破性的AI工具将终结长期存在的SaaS模式。 这一观点并非特别新颖,但一直不断被提及,微软CEO萨蒂亚·纳德拉(Satya Nadella)等人士就持此观点。 今年早些时候,纳德拉在BG2播客中表示,智能体将具备“多存储库增删查改”(创建、读取、更新和删除)功能,这将使底层SaaS工具变得过时。
8/4/2025 7:00:00 AM
Grant Gross

一键自动化做图!教你用Coze搭建Lovart智能体

大家好,我是叁石。 继上篇文章之后,大家对 Lovart 的有了一定的了解,也对什么是智能体有了些体会。 所以,我突然有了个想法,能不能通过 coze 来模拟 Lovart 的智能体逻辑,我们自己给自己搭建个智能体来给自己工作,听起来还蛮有意思的,所以我花了 1 周的时间,在工作之余摸索了 coze 的搭建逻辑,发现还真的可以。
8/4/2025 6:59:30 AM
体验设计